[Course Forum] 17000+ modern popular worlds (Eng for Rus)

The English course for Russian.
Ссылка на курс
Курс был создан автоматизированно на основе Google.
Я взял 50000 самых популярных слов, удалил то, что словами не является, получилось чуть больше 17000, которые и были выгружены в Memrise.
Вы можете взять исходники данного курса здесь и использовать их где-то еще, или даже вносить правки.
В данном форуме можно задавать вопросы по поводу курса, предлагать исправления.

4 Likes

Если автор на досуге добьет до “ровного счета” в 20K слов, то будет здорово!
А так конечно респект!

Курс создан автоматическими средствами, можно и 100к слов набить. Но добавлять слова имеет смысл, только если хоть кто-нибудь выучит эти 17000 :slight_smile:

2 Likes

Здесь можно почитать, как оптимизировать обучение в Memrise, и как еще можно учить язык.

3 Likes

А каким способом была получена выборка из 17к слов. Сам Ngram Viewer насколько я понял, в версии через сайт имеет ограничение в 5 слов на графике. API у него, как такового, я не нашёл. Данные скачивались и обрабатывались скриптом? Или возможно я что-то проглядел в справке?

На странице Ngram Viewer в самом низу страницы есть текст “Raw data is available for download”, там собственно можно скачать исходники - списки слов в виде текстовых файлов. Я скачал все файлы из раздела “1-grams” и скриптами на Python перегнал их в базу данных, а от туда уже достал отсортированные списки.
Потом другой питоновский скрипт забрал переводы слов с google translate, причем забирал только помеченные как “Популярные переводы”. Озвучку и транскрипцию я взял еще с нескольких ресурсов, тоже скриптами.
Ну и курс выложил на memrise еще одним скриптом, 17000+ слов примерно 3 дня выгружались.

3 Likes

Вы проделали офигенную работу и сделали самый крутой курс на Мемрайзе. Я там уже два года каждый день ботаю. 40 тыс слов за два года выучил (разумеется, не только английский). И уверенно заявляю — Вашему курсу равных нет! (С поправкой на то, что новичкам все-таки не с него начинать надо)…
А реально ли что-то подобное сделать со словосочетаниями? Не все “смысловые единицы” выражаются одним словом. Есть много “вещей”, которые называются двумя словами, а то и тремя. Не говоря уже об устойчивых словосочетаниях, идиомах, фразовых глаголах и т.д…

P.S. Как бы мне научиться так же программировать как Вы? =) Где этому всему можно научиться?

Очень жаль что Вы отсортировали вообще все слова в порядке частоты употребления в тексте. Имхо, числа, названия дней недели и месяцев, все имена собственные (London, Britain etc) стоило выделить в отдельный базовый уровень, где их можно пачкой заигнорить, или вообще исключить из курса.

Да не говорите ерунды.
Если Вам нужна сортировка по темам — для этого есть очень много других курсов, в том числе у меня. По географии вообще есть много отдельных курсов на английском языке тут на Мемрайзе.
А сортировка частотных словарей — это отдельная тема. Проходить это конечно нужно уже после того как у Вас уровень языка intermediate, это не для новичков. И, в процессе прохождения частотного словаря, очень много слов нужно добавлять себе в игнор.

petr.n.rozhanskiy
Вы вообще с кем разговариваете? Я писал о том, что по моему мнению есть в курсе лишнего, просто как отзыв, а вы телепатически оценили мой уровень, отправили учить курсы по географии и еще какой-то бред.

Я лишь сказал, что то, что Вы ищете, есть в других курсах.
Если нужно — могу дать конкретные ссылки. Покопаться?
А частотные словари — это именно частотные словари, без разбивки по темам. В этом и заключается их специфика.
Что-то Вы слишком остро реагируете на критику -)

Вот тут, например, Вы можете найти отличные курсы с разбивкой по темам и от простого к сложному:
http://www.memrise.com/user/lvlmasterlvl/courses/teaching/
Курсы очень хорошие. Там не только слова, но и словосочетания. Суммарно 9000 слов/словосочетаний, но в сухом остатке не более 4000 отдельных слов. Я участвовал в их редактировании (проставлял синонимы вручную).
Кроме этого можете найти много тематических курсов на моей странице.

Calm down, bro -)


@zashibis,
К сожалению, этот идиотский форум Мемрайза не позволяет писать больше трех ответов в одной теме. Поэтому пишу методом редактирования предыдущего моего сообщения.

http://envoc.ru/code/idioms/idioms_a0.php
http://envoc.ru/code/frverb/frverb_a0.php
— тут есть хорошие списки идиом и фразовых глаголов в количестве нескольких тысяч с примерами употребления.
По поводу устойчивых словосочетаний — готовых списков не встречал -(
Если интересно — могу покидать еще кучу ссылок с готовыми списками словосочетаний разного рода… У меня на ноуте где-то пылятся…

Возможно ли сделать частотные словари по другим языкам? Немецкий-Испанский-Французский хотя бы… - ? Тут на Мемрайзе частотные словари только по английским словам… Возможно, это связано с тем, что по английским словам есть для этого какие-то готовые материалы, а возможно просто никто не заморачивался сделать такую офигенно полезную вещь по другим языкам…

Как мне научиться так же программировать? -)) Есть в интернетах какие-то курсы? Можете что-то порекомендовать?

Господа, не ссорьтесь :slight_smile:
Это базовый курс, тут все в кучу свалено. Пройдя 10 тысяч слов вы будете знать и дни недели, и месяца, и популярные города. Если вам срочно необходима какая-то особая тема (части тела, география и т.д.), то действительно можно пройти тематические курсы.
Про то, что курс “не для новичков” - не соглашусь. Если вы знаете 300 слов и алфавит - ничто не мешает начинать данный курс, первые 10 уровней содержат самые важные слова. Уровень Intermediate может спокойно игнорировать первые 20 уровней.
Про идиомы и фразовые глаголы: у меня есть список фразовых глаголов из 1000+ слов, я также могу довольно быстро составить список из 1000+ идиом. Скрипт отсортирует это все по популярности за пару дней, еще за 3-4 дня я могу сделать озвучку (если конечно надо). Главная проблема - найти качественные переводы, этого у меня просто нет и скриптами взять негде. Надо все обрабатывать вручную, а на это просто нет времени.

Спасибо за предложения, но нет. За прошедшее время я сильно разочаровался в Мемрайзе. В основном из-за скудности настроек.

Самое разражающее это то, что новое слово будет повторяться 6 раз, даже если мне хватило 2-х или вообще одного. Бредовое значение, которое очень неэффективно расходует время.

Во -вторых невозможность редактирования. Например, в данном словаре часто попадается, что наиболее употребительного перевода вообще нет в списке (effciency, item, framework, latter), Или пара слов которые пишутся одинаково, но означают разное (не знаю как они правильно называются) - пример solution / decision по русски одинаково - решение. К таким очень хочется оставлять комментарии.

zashibis
Пожалуй, попробую перетащить вашу колоду к себе в Anki. Большое спасибо за проделанную работу!

Так вы пишите на форуме, что надо поправить в курсе, или прямо на гитхабе изменения предлагайте.
Все изменения вносятся в текстовый файл, потом я запускаю скрипт и он выполняет обновление курса на memrise, это все очень быстро можно сделать.

@petr.n.rozhanskiy,
Спасибо за ссылки, выглядят неплохо, попробую чуть позже создать курс из них.
Ранее я собирал материалы только в варианте “Фразовый глагол” - “Описание на английском”, это вроде как интереснее учить было бы.
“Немецкий-Испанский-Французский” - я к сожалению не владею этими языками вообще. У Google есть подборки слов для Китайского, Французского, Немецкого, Иврита, Итальянского, Русского и Испанского, но без базового знания языка из них не сделать Курс. Там ведь только сами слова без перевода, причем две трети из них вовсе не слова, а производные (прошедшее время и т.д.). После обработки скриптами все равно приходится проверять все глазками.
По поводу языков программирования, можете начать с этого: Учебник Python

Ранее я собирал материалы только в варианте “Фразовый глагол” - “Описание на английском”, это вроде как интереснее учить было бы.

Что касается именно фразовых глаголов, то их удобнее всего учить в контексте, чтобы различать коннотации, ибо там очень много синонимов с тонкими различиями, примерно так: “come across (alt ‘came across’)” = “I suddenly [наткнуться; неожиданно встретить] Mike today in the shopping center”…

“Немецкий-Испанский-Французский” - я к сожалению не владею этими языками вообще. У Google есть подборки слов для Китайского, Французского, Немецкого, Иврита, Итальянского, Русского и Испанского, но без базового знания языка из них не сделать Курс. Там ведь только сами слова без перевода, причем две трети из них вовсе не слова, а производные (прошедшее время и т.д.). После обработки скриптами все равно приходится проверять все глазками.

Да, тут наверное посложнее… Но все равно, думаю, можно что-то придумать… Аналогов в интернете не видел, везде частотные словари только по английскому -(
А можно ссылки на гугловские подборки? Вдруг я через годик научусь как Вы программировать и тоже попробую что-то похожее сделать…

По поводу языков программирования, можете начать с этого: Учебник Python

Я проходил курсы Python на Coursera.Org и Stepic.Org. Но, насколько я понимаю, здесь другое задействовано: JS с какими-то готовыми фреймворками…
Можно даже без ссылок — можете просто сказать какие языки и фреймворки нужно изучить? Не начальный этап, а весь фронт работ… Учебные материалы я уже найду сам -)
Всегда впечатляло как такие люди за несколько часов пишут программу и она еще за несколько часов делает то, что челове вручную делает годами… Очень хочу так же уметь и готов много и долго учиться -)

Для подготовки данного курса я использовал именно Python и библиотеку Selenium. Мой скрипт открывает браузер и имитирует поведение пользователя (только в разы быстрее). Т.е. я не использовал JS напрямую, тут достаточно базовых навыков HTML. Это очень примитивно, работает нестабильно и относительно медленно. Но я потратил на скрипт всего 2 часа :slight_smile:

И да, насчет словосочетаний.
Я имел ввиду не только фразовые глаголы и идиомы, а просто устойчивые словосочетания, когда одно понятие выражается двумя-тремя словами. Ну например:
windshield wiper = дворник (автомобильный)
rain cloud = туча
to get wet = промокнуть
to lose one’s way = заблудиться
artificial lake = водохранилище
to take aim at = целиться в
barbed wire = колючая проволока
machine gun = пулемет
chain armour = кольчуга
dead end = тупик (конец дороги)
death penalty = смертная казнь
… перечислять можно очень долго: есть многие тысячи устойчивых словосочетаний. и знание отдельных слов не поможет — нужно заучивать готовые словосочетания в этом случае…

За ссылки спасибо. Даже не думал что все это можно одним только Python’ом сделать…

Спасибо за курс!
Подскажите пожалуйста каким образом можно убрать одну из озвучек?

Сейчас озвучка загружена одной сплошной аудио-дорожкой: два варианта на американском-английском, потом через паузу два варианта британского английского. Т.е. сейчас вы никак от нее не избавитесь.
Я могу разбить озвучку на две дорожки:

  1. два варианта американского английского
  2. два варианта британского английского.
    Либо:
  3. вариант US, через паузу вариант UK
  4. второй вариант US, через паузу второй вариант UK
    В этом случае при изучении вам всегда будет воспроизводиться первая дорожка, а вторую можно будет послушать опционально - только при просмотре информации о слове.
    Это уже вопрос ко всем изучающим курс - подойдет ли вам такое?