[Course Forum] 17000+ modern popular worlds (Eng for Rus)

petr.n.rozhanskiy · October 18, 2016, 10:17am

Лучше оставьте как есть. Аудио можно пропускать просто два раза подряд нажимая enter после воода ответа. Или сразу enter после выбора нужного варианта. Не понимаю в чем проблема. Чем больше аудио тем лучше. Я его вообще всегда проскакиваю все равно, только на первичном заучивании слушаю.

Frid_Reich28 · October 19, 2016, 6:05pm

Мне бы хватило одного варианта для проверки произношение вдруг я совершено не правильно читаю слово, предполагал возможность изменить в настройках, ну да ладно, это не критично.

zashibis · October 20, 2016, 7:48am

Одного варианта какого, британского или американского?
Китайский вариант английского еще забавно звучит

Bangmotif · October 20, 2016, 3:29pm

Привет, Зашибис.

Судя по всему, либо скрипт составлен не самым удачным образом, либо брать переводы с GT — не лучшая идея. Для наглядности смастерил соответствующие иллюстрации на эту тему: первая (even), вторая (may, further). Красным выделены проблемные места. Как понял, имеются такие недостатки: 1) не захватывались переводы, которые GT кидает в окно с результатом (например, для слова may это оказалось критичным, потому что в списке снизу не учитывается, что May — ещё и май; при этом в txt-исходнике курса мая нет вообще, но есть остальные месяцы); 2) сам GT — не лучший источник достоверных переводов (перевод чётный для слова even указан как редко используемый, при том, что других переводов на английский язык у слова чётный нет вообще; хотя, конечно, может, англоговорящие люди действительно редко рассуждают о чётности чисел, но очевидно, что изучающему английский этот перевод знать нужно); 3) не разобрался с причинами, но для слова further не захватились прилагательные: возможно, ты их сам удалил по личным соображениям, хотя это было бы очень странно, потому что, например, дальнейший — очень ходовой перевод для further.

Есть ещё множество вопросов и замечаний, но решил не вываливать всё огулом, а начать с самого главного. Сама идея курса мне очень понравилась, но перейти с 12527 мешают подобные недоработки.

Frid_Reich28 · October 20, 2016, 5:41pm

Индийский)
Думаю американский предпочтительней.

zashibis · October 21, 2016, 12:39pm

@Bangmotif
GT действительно не идеальный источник, но более качественного найти не удалось. Если у слова 20 вариантов перевода, то только GT покажет, какие же из них употребляются чаще.
По мере прохождения курса я вношу в него правки, это можете делать и вы: все изменения вносятся в текстовый файл, а скрипт потом быстро обновляет Memrise.
Для GT часто важно, заглавная ли буква первая, или строчная. Именно поэтому may у него не перевелось как май

Bangmotif · October 22, 2016, 7:41am

А как часто запускаешь скрипт? Вообще, я, возможно, мог бы посидеть, почекать слова через разные словари, например, первую сотню, пока ты в это время обстоятельно проходился бы по второй сотне, а какой-нибудь Пётр Рожанский — по третьей, и со временем у нас бы вышел топовый курс для пополняющих свой англоязычный вокабуляр, но хотелось бы, чтобы это не улетело в пустоту, если ты, например, неожиданно забьёшь на всё, или просто будешь занят, или откинешь коньки. Склеишь ласты. Двинешь кони. Подскользнёшься в могилу. Я к тому, что исходники неплохо было бы почаще обновлять Ну и попробовать собрать команду (чтобы организовать процесс, и чтобы был адекватный чат через какой-нибудь Telegram). Особенно если на основном сайте есть модерский инструментарий для работы на курсами.

И ещё несколько вопросов:

В исходнике есть примеры употребления для каждого слова — очень полезный механизм. Но в курсе они отсутствуют. Они отключены, или это я не могу их найти?
Синонимы, по всей видимости, собирались скриптом. Можешь ли ты их автоматически пополнять при добавлении новых переводов? Или приходится ручными средствами это делать? Например, то же слово дальнейший уже встречается в курсе среди переводов слова ulterior, но понятно, что слова ulterior ещё нет среди синонимов слова further (т.е., после «не:»), как и слова further нет среди синонимов слова ulterior, что является потенциальной проблемой.
Насчёт озвучек. Если их разделить на 2, 4, 10, 20, то можно ли сделать так, чтобы каждый раз воспроизводилась каждая из них, а не только первая/рандомная?

Bangmotif · October 22, 2016, 7:51am

В Google Drive можно будет создать таблицу на 17000 строк (я уже попробовал — GD выдерживает без проблем): в первом столбце порядковый номер, во втором — слово (без переводов, синонимов и т.д.). То, что уже проверено вручную, выделять зелёным цветом (т.е. ячейку заливать), а то, что, например, требует тщательной дискуссии, выделять жёлтым и т.д. Так даже не придётся разбивать всё это дело на сотни: каждый сможет в своё удовольствие в свободное время пилить то, что ещё не готово.

P.S. Можно и третий столбец запилить, в котором тот, кто редактировал строчку, указывал бы свой ник.
P.P.S. От руинеров в GD есть защита: можно легко откатывать файл до любой из предыдущих версий (“слепки”, по-моему, делаются буквально после каждого изменения).

Bangmotif · October 22, 2016, 8:50am

Запилил пример таблицы (на случай, если ты не работал с GD, и думаешь, что я предлагаю что-то очень душное): линк. В четвёртом столбце, например, делаешь пометки для себя, чтобы знать что именно уже добавил в скрипт/курс, и не проверять по десять раз одно и то же.
К сожалению, в командном режиме мне ещё не доводилось пользоваться GD, но, насколько я знаю, там имеет место система предложений: т.е. пользователи, не являющиеся админами таблицы, могут кидать изменения в “предложку”. В общем, этот момент нужно практикой проверять, если тебе вообще интересна подобная инициатива.

Конечно, вариант пока что не идеальный (я только сейчас понял, что редакторам нужно же ещё куда-то отправлять свои предложения для изменений :D), но пока что это всё всё равно на уровне идеи. Можно банально в новый столб предложения кидать.

В любом случае, возможно, тебе самому пригодится подобная таблица, даже если один будешь работать.

zashibis · October 25, 2016, 2:30pm

Для повышения Bus-фактора я могу дать права редактирования курса кому-то еще, кто себя зарекомендует
Команда - это хорошо, но у меня очень большая загрузка на работе и вечно не хватает времени. Кое-как нашел силы курс создать скриптами.
По вопросам:

Примеры употребления слова я планирую вставить в Подсказки Memrise (они же Mems), но для этого скрипт пока еще не готов. До нового года сделаю, т.к. учить слова без контекста все сложнее.
Синонимы пересчитываются автоматически. Если для further добавить перевод “дальнейший”, то один скрипт обновит список синонимов, а другой добавит синонимы в карточки Memrise, тут проблемы нет.
Memrise проигрывает озвучку рандомно. На андроиде проигрывается только одна из озвучек. Тут все плохо, как редактор курса я на это повлиять не могу. Поэтому сделал озвучку US_US____UK_UK

zashibis · October 25, 2016, 2:39pm

Я сделал свой вариант таблицы: ссылка
Готов дать права на редактирование всем желающим, пишите запросы тут и в GoogleDocs. Если будут полезные правки, я готов запускать скрипт обновления карточек Memrise раз в 3-4 дня. Сам скрипт отрабатывает часа за 2 (проверяет и обновляет все 180 уровней).
Сам скрипт выложен тут, запустить его - отдельное шаманство, но при желании могу научить.

Bangmotif · October 26, 2016, 3:10am

Отправил запрос на права.

И ещё один вопрос появился: как ты получал отметки UK и US? В GT найти этого не могу. Самостоятельно по другим словарям шерстил? Идея-то хорошая, но, по-моему, это очень условный момент, который до идеала тяжело будет довести. Например, слова toward и towards. В курсе второе отмечено как [UK], а первое не отмечено никак. Но по первой же ссылке в Гугле я нашёл вот что:

Суффикс “-ward(s)” в британском диалекте обычно используется в виде “-wards”, а в американском как “-ward”. Речь идёт о словах forwards, towards, rightwards и т.д. Тем не менее, слово forward активно используется и в Британии, а слова afterwards, towards, forwards не являются необычными и для американского диалекта.

Но опять же, если не воспринимать эти отметки строгой аксиомой, то польза от них очевидна. С третьей же стороны, это всё-таки пыль в глаза для обучающихся.

Насчёт озвучки. Её либо делить на US-UK и US-UK (чтобы для тех, кто занимается по приложению на андроиде, была возможность слышать и американский и британский варианты произношения), либо немножко подкорректировать. Я не уверен, но, возможно, вся её нынешняя проблема сводится к тому, что паузы между словами разные: *слово* — *короткая пауза* — *слово* — *длинная пауза* — *слово* — *короткая пауза* — *слово*. Из-за этого возникает неприятное рваное ощущение, будто сосед за стеной с разными промежутками включает дрель. Или будто громкость фильма постоянно меняется, как на старой VHS-кассете с гундосой озвучкой. Или будто взрослого кота пустили в квартиру весной. В общем, не наблюдается музыкальной гармонии в этих озвучках, из-за чего я сомневаюсь в оправданности присутствия длинной паузы: по-моему, нужно все три остановки сделать одинаковыми, но чуть-чуть длиннее тех, которые сейчас считаются короткими. Понятно, что изначально длинная пауза делалась для удобства, но я вижу решение проблемы восприятия в том, что благодаря средним паузам слова не будут звучать кашей, и в том, что большинство людей способны досчитать до четырёх (хотя недавно видел статью на Вики про язык небольшого народа пирахан, доказывающий, что математика — изобретение человечества, ибо в том языке нет цифр: его носители просто более-менее ориентируются в пределах трёх предметов, но дальше у них начинает ехать крыша).

Про примеры употребления. Я правильно понял, что ты хочешь добавить примеры в те Mems, которые появляются после нажатия кнопки «Help me remember this»? Почему не в отдельную колонку? Получится примерно так (взял один из самых длинных примеров твоего курса). Если эта строка будет отображаться и в той карточке, которая появляется, когда пользователь совершает ошибку, то, по-моему, лучше не забивать примерами употребления слот среди Mems, ибо, например, я, и, я уверен, многие другие юзеры, активно используют эти слоты для собственных картинок, создающих индивидуальные ассоциативные ряды, полезные для запоминания. А выбирать слот можно только один, из-за чего будет постоянная дилемма: либо примеры употребления, либо собственная подсказка. Лучше, если пользователю будет доступно и то и другое.

Ещё одна потенциальная беда, касающаяся скрипта для синонимов. Надеюсь, что ты либо сам это удалил, либо просто давно не делал обновления, но у слова in среди синонимов нет слова with, хотя у with есть in. Наглядно накидал тут: линк. Если это косяк скрипта, то ставится вопрос о необходимости проверять все синонимы собственными пальцами. UPD: Заметил уже после изготовления картинки, что слова from среди синонимов in тоже нет, хотя у from всё есть.

Вообще, предлоги, артикли и прочая нечисть — отдельная история для любого подобного курса. Думаю, стоит их как-то обособить в одну группу, и собрать консилиум для поиска решения этой проблемы. Как вариант, для начала можно позаимствовать описания или часть описаний из 12527, а потом уже насаживать на них собственные корректировки, как бусины на ниточки. Ещё идея: т.к. большинство людей наверняка сразу же ставят всю эту балладу в игнор (ибо, даже разбираясь в предлогах, очень трудно правильно подбирать ответы в условиях Memrise), то можно все эти строчки либо вообще перенести в другой курс, либо как-то отметить их крестиками какими-нибудь или аббревиатурами вроде [UK]/[US], чтобы люди, кому это надо, не выгибались под горбом, начиная курс не с обучения, а с утомительного выискивания лишних слов (новичкам тут вообще задница: большинство либо решат, что предлоги, наверное, надо таки учить, и сдадутся в первые же дни, либо не поймут, какие предлоги надо игнорировать, а какие — нет, и опять же у них будет каша в голове; лично я 12527 начинал в своё время несколько раз, потому что постоянно забивал на занятия из-за срани с предлогами).

Bangmotif · October 26, 2016, 3:17am

А для тех, кто тоже будет заниматься проверкой курса, предлагаю составить обязательный чек-лист вроде такого:

Сначала нужно проверить у данного слова целостность переноса переводов с Google Translate: всё, у чего есть “длинная полосочка” или “средняя полосочка” + “то, что есть в окне результата, а не только в списке снизу”, должно быть внедрено в курс (с сокращениями лишнего, само собой, если они требуется, но сокращения лучше обсуждать).
Далее. Через гугл и по посторонним источникам нужно найти всю полезную информацию о переводах данного слова, систематизировать её и сократить до разумных пределов, чтобы можно было добавить в курс.
Как только начну заниматься проверкой таблицы, наверняка почти сразу же обнаружу годные словари, вычислю их основные недостатки и т.д., так что, возможно, появятся какие-то рекомендации по источникам. Всем остальным тоже предлагаю делиться подобной инфой.
Желательно проверить порядок переводов для данного слова, и поставить на первые места то, что на слуху у всех: т.е. не очень разумно, когда у слова can первым переводом идёт баллончик, а только потом может. Этот момент часто очень субъективен, так что будет разумным его обсуждать.

Понятно, что при всём при этом стоит обращать внимание на банальные ошибки и опечатки, а замеченные повторы слов и т.п. выносить на обсуждение.

Bangmotif · October 26, 2016, 3:25am

@zashibis И подумай всё-таки над созданием конфы для редакторов, потому что если, например, мы оба окажемся в онлайне, и при этом оба будем работать с таблицей, то форум очень быстро даст знать о своих недостатках, ибо наверняка многие моменты нужно будет обсуждать не в виде огромных писем, а в режиме мгновенного диалога, который в условиях форума быстро скатится в геморрой. ВКонтакте и Telegram — хорошие варианты, и наверняка почти у всех там есть аккаунты.

Вроде, получил доступ, и уже собирался вносить изменения, но те изменения неоднозначны в плане оформления, поэтому… Думаю, подожду твоего ответа. Если всё же создашь конфу, то я лучше там все эти мелкие вопросы буду задавать, чтобы форум не засирать.

zashibis · October 26, 2016, 11:58am

@Bangmotif,
отметки US и UK проставлены на основа данных из официальных сайтов Кембриджского и Оксфордского словарей, скрипт и по ним проходился. Я думаю, им можно доверять.
С озвучкой можно поиграть, я пришлю вам варианты, что-нибудь выберем. Озвучку можно полностью обновить скриптом дня за 3-4.
Примеры употребления: если сделать их отдельным полем, то их не увидят пользователи IPhone. Они даже транскрипцию не видят. Но можно конечно забить на них и сделать отдельное поле, это даже проще с точки зрения скрипта. Подумаю над этим на неделе.
Скрипт для синонимов имеет ограничение: если синонимов набралось больше, чем на 130 символов, то он прекращает поиск. Слишком большое количество синонимов плохо отображается в карточках. Можно снять ограничение, или увеличить порог, но тогда у слова in будет штук 20 синонимов.
Предлоги - отдельная большая тема. Их надо учить в контексте: с разными словами может быть употреблено in, on, at, by - а перевод на русский будет один. Для этого есть другие курсы. Возможно, их и правда стоит просто удалить от сюда.

zashibis · October 26, 2016, 12:01pm

@Bangmotif,
я могу создать чатик в Skype для всех редакторов курса, там можно будет обсуждать мелочь. Доступ к чату выдам всем, кто присоединится к редактированию таблицы, приглашения буду высылать на гуглопочту. Проверенным пользователям будут выданы права на редактирование самого курса на Memrise.

zchenzo · October 29, 2016, 1:26pm

Можно повыступать адвокатом с немного другой стороны? Я таки перетащил означенный курс в Anki и, субъективно, там намного удобнее чем в Memrise - просто больше настроек и возможностей. И наконец-то мне не повторяют каждое новое слово 6! долбаных раз - только ради этого стоило. Было бы здорово сделать курс универсальным, т.е. чтобы он подходил и для Memrise и для Anki. В обоснование такой позиции, как вы сами сказали, обновить курс на Memrise - это шаманство (если скрипты опираются на DOM, то они полетят при первом же его обновлении, что не есть надежно), а стать редактором курса надо еще и заслужить. В Anki таких проблем нет.

Тот курс, который сейчас выложен на гитхабе, в принципе, готовая колода для импорта в Anki, не хватает только озвучки. В Anki она цепляется достаточно просто: mp3 файлы лежат ~/Documents/profile_name/collection.media, а при импорте в отдельной колонке просто указывается имя файла. Когда я выкачал ваш курс с Memrise, аудио получилось на ~600MB. Грузить AnkiWeb такими объемами мне кажется не этично, да и синхронизироваться будет очень долго, поэтому было бы реально здорово ужать озвучку в 2-4 раза. Основная задача, которую надо решить, это обновление колоды. Готов заняться. Уверенности, что точно есть способ подсосать изменения и при этом сохранить прогресс изучения у меня, но стоит попробовать. Вообще я джавист, но по крестьянски на питоне смогу.

По недостаткам самого курса (может повторюсь):

Предлоги.
Голосую за удаление, ибо не нужно. Если реально есть люди которые учат вот эту муть “в; из; на; от; из-за; по; к”, я им очень сочувствую. Есть много хорошей инфографики по данной теме, начинать надо с нее. Параллельно с отдельным курсом по фразовым глаголам.
Числа. Названия дней недели. Названия месяцев.
Это надо учить подряд, а не по частотному словарю. Что бы не было ситуации : Здравствуйте, я выучил 2 тысячи слов, и умею считать “one, two, five, seven, nine” - остальных пока не было. Если их оставлять, то надо вынести их в первую сотню. Это правильно и логично.
Имена собственные
В вашей колоде есть Санта-Клаус, Иудаизм и еще куча подобной ерунды (я при переносе просто удалил все слова, начинающиеся с заглавной буквы). Предлагаю добавить в колоду самой последней колонкой (опциональный) список тэгов. Тогда любой желающий сможет парой строчек на bash или питоне, вывести их список и по данным тэгам дропнуть ненужные ему слова.
US-UK
Голосую за удаление UK, потому что очень редко где видел эти: labour, colour, behaviour и прочие французские окончания. За суффиксы уже выше сказали.

Алсо, с гугл-докс кажется не очень хорошая идея (у меня в лисе дико лагает при открытие и прокрутке, невозможно работать), но видимо безальтернативная, не все умеют коммитить в гит.

Bangmotif · October 30, 2016, 5:29am

Предлоги. Числа

Зашибис, видимо, на работе зашивается, ибо два дня как пропал из скайпа, хотя должен был ещё позавчера ответить насчёт удаления всех лишних слов из курса. Лично я, помимо числительных и всех “ходовых” предлогов, предлагаю удалить ещё и почти все местоимения, союзы, модальные глаголы и прочие подобные слова, которые, во-первых, почти нереально выучить через Memrise, а во-вторых, как я успел понять, попросту должны учиться вместе с грамматикой, а не в процессе активного пополнения словарного запаса.

Названия дней недели. Названия месяцев. Имена собственные

Именам собственным вроде Христоса или Санта-Клауса действительно нечего делать в курсе, а вот дни недели и названия месяцев — очень спорный момент. Не уверен, что их стоит грести под одну гребёнку, ибо в некотором смысле они больше походят на нарицательные. Я бы их скорее отнёс к словам вроде live, death, big, good — вроде бы всем известные слова, но удалять их нельзя, потому что неизвестно где проходит граница.

удаление UK

Мне кажется, что, во-первых, это будет очень трудный в плане технического исполнения момент, т.к. разница между американской и британской формами не сводится к окончаниям -or/-our: есть ещё и -er/-re, -ize/-ize, -og/-ogue, двойные l, а также куча всяких исключений, плюс, разница в словарном составе и разница в словоупотреблении, и это всё при том, что отметки [UK]/[US] в курсе, как выяснилось, установлены не самым идеальным образом. Во-вторых, всё же есть люди, которые учат британскую версию языка, а тот же colour указан в первой строчке на английской Википедии в статье “Color”, так что, хоть и редко, но эта срань всё-таки встречается. Хотя я согласен, что недоработка имеет место, и нужно что-то решать с этим. Подключайся к команде редакторов, и будем вместе что-то придумывать :3

гугл-докс кажется не очень хорошая идея (у меня в лисе дико лагает при открытие и прокрутке, невозможно работать)

У меня довольно слабенький комп, но на хроме всё очень даже летает, нет ни одного лага при прокрутке. Полное открытие длится секунд 15-20. Возможно, дело именно во фраерфоксе.

zchenzo · October 30, 2016, 7:35am

Поэтому я и написал, давайте не будем удалять спорные вещи, а добавим последней колонкой тэги, и если кого-то не устроит курс на Memrise, его можно будет пройти в Anki, удалив ненужные слова.
Также думаю имеет смысл вбросить “рекламу” курса на Pikabu, например, может побольше заинтересованных людей поднаберется.

Bangmotif · October 30, 2016, 9:10am

Не стоит забывать про юзерфрендли-элемент. Я именно за удаление спорных вещей: нужно просто определиться с политикой курса, чтобы знать, где проводить черту. Если в описании указать, что это частотный словарь, но из него удалены такие-то группы слов, то ни у кого не возникнет проблем с тем, что ему придётся учить цифры и числа где-то в другом месте: источников, специализирующихся на таких темах, полно (можно даже ссылки на хорошие источники в том же описании оставить). А просто колонка с тэгами станет серьёзным препятствием для любого начинающего: даже если он разберётся, как достать в один список все эти слова (не все слышали про питон и баш), то ему всё равно придётся в первые дни решать горы дилемм, ибо новичок на то и новичок, что он не может точно сказать, какие слова ему нужно учить, а какие — нет, особенно учитывая, что проблемных слов там несколько сотен наберётся, а это неподъёмный объём в таких условиях. Тэг “на удаление” не скажет новенькому вообще ничего, а тэг “притяжательное местоимение” так и вовсе сведёт его с ума. Я думаю, что именно редакторы и создатель должны попотеть, принять важные решения, и сделать из курса конфетку к английскому чаепитию.

Про Anki ничего не могу сказать. Андроидная версия у меня не работает, а у ПК-шной интерфейс начала нулевых.