среда, 10 ноября 2010 г.

Новая дека (2000 часто используемых слов)

Вобщем посмотрел я посмотрел свои деки, и провел работу над ошибками, результат - дека English-Russian most used (можно скачать из анки из меню shared decks)
были устранены недостатки
  • Теперь все качается с google.com/dictionary (а не translate.google.com)
  • В деках присутствует транскрипция
  • Если у слова 2 произношения, то качаются оба и склеиваются в один файл
  • Качается полный перевод(все значения что показывает гугл), забавно было, когда бралась только первая часть :), только из за этого и переписал скрипт, как вам дека только с первой частью перевода словa queen от гугла :) ? какой перевод расскажет ученик у доски фразы "queen Victoria"?
  • Главный перевод, - тот что первая строчка оборота карточки, состоит из первых слов перевода для глагола, существительного и т.п. этого слова
  • Теперь в деке присутствует модель. Раньше было всего лишь 2 поля(слово - перевод) теперь же 5 полей, и при желании можно отключать ненужные вещи
  • Убраны картинки, те что качались с гугла, все равно мельтешили, и никакой нагрузки не несли
  • Ну и хоть я и не эксперт в питоне, но переписал скрипт именно под него, и теперь при желании можно запускать скрипт под виндой (хотя я это не пробовал, но шансов на положительный успех больше)

из недостатков кода, к сожалению все захардкожено
  • нужно создавать руками папку media в папке с скриптом
  • никаких входных параметров, поэтому входной файл "input" (с которого берутся слова)
  • обработка ошибок тоже так себе, - если чтонибудь не получилось, то слово игнорируется (так что смотрим лог, на предмет слова fail

скрипт тута

поступила информация, что с сайта anki у некоторых скачивается с ошибкой, поэтому можно скачать эксорт деки от сюда

14 комментариев:

Анонимный комментирует...

спасибо за деки и скрипты)...можешь объяснить по шагам как сделать так, чтобы вводя новое слово, перевод и тд сам автоматически появлялся..

NiCloAy комментирует...

На здоровье,
Я так понимаю вы говорите про ввод слова в интерфейсе программы anki, так автоматом ничего не появляется, - нужен плагин для самой anki, здесь же создаются только экспортные данные.

Анонимный комментирует...

ок, спасибо

vomr комментирует...

выполняю в терминале команду
python init.py

Выдает ошибку:

File "", line 1
python init.py
^
SyntaxError: invalid syntax

может я, что-то не так делаю, в чем может быть ошибка?

vomr комментирует...

а все разобрался я писал файл INPUT а не INPUT_FILE

Анонимный комментирует...

Выходит ошибка:

File "init.py", line 148, in
getWord(word)
File "init.py", line 141, in getWord
resultString=word.strip()+"\t"+translateSummary.strip()+"\t"+transcriptionSum+"\t"+translations.strip()+"\t[sound:"+pronunciationFileName.strip()+"]\n"
UnicodeDecodeError: 'ascii' codec can't decode byte 0xef in position 0: ordinal not in range(128)

В каком виде должен быть входящий файл? у меня 1 слово в одной строке пример:
the

be

and

of

a

in

to

NiCloAy комментирует...

Я думаю для начала надо попробовать создать исходный файл со словами в UTF-8 формате. Я не особо знаком с python но так как я все операции делал на linux -то и кодировка там всегда по умолчанию utf8

Анонимный комментирует...

привет, а ты можешь сделать деку по другим словам?...я тут нашел список 6000 слов..просто сам не разбираюсь в программировании(

http://db.tt/yoyvibi
6000 слов...

NiCloAy комментирует...

а это случайно не таже самая?
http://nicloay.blogspot.com/2011/01/bnc-anki.html
тоже 6000 )), частоиспользуемых.

Анонимный комментирует...

не, это другие, я проверил))

NiCloAy комментирует...

мда.. другой ? а в чем главное отличие?
просто список не совсем удобный, из за того что часть речи не обозначена.

Анонимный комментирует...

ну в твоей деке, где 6000 слов...там у тебя с разными частями речи 6000 слов..те слова повторяются, а тут без повторений... вообще это я сам убрал части речи из списка, раньше было 7037 с частями речи...
по мне так твоя дека, где 2000 слов гениальна)) просто маловато слов... а учить по частям речи мне кажется не очень удобно

NiCloAy комментирует...

вобще по частям речи учить мне показалось более логичным потому как глагол и прилогательные разные вещи.
Вобще когда без частей речи - то гугл для некоторых слов возвращает очень много вариантов. Поэтому с частями все очень проще, плюс например если не нравятся предлоги и причастия, то их можно вобще отключить.

Вобще в блажайшее время собираюсь собрать другую деку, главное отличие которой будет в произношении как английских так и русских слов, плюс может добавлю examples которые выдает гугл.

Потому как после переезда в англоговорящую страну первое что мне очень сильно пригодилась, это дека с фразами - после нее за неделю - две адаптировался к речи. Сами слова такого результата дать не могут.

Произношение русских же нужно - чтоб учить деки на ходу, имею ввиду инсталяцию анки на android или iphon.

Анонимный комментирует...

пожалуй ты прав на счет того, что учить по частям речи удобнее))