Универсальная программа для создания словарей и изучения. Как сделать свой собственный словарь Stardict? How to create your own stardict dictionary? Открытие диалогового окна "Вспомогательные словари"

ВВЕДЕНИЕ

Мир все сближается друг с другом политикой мирового общения и культурного обмена многих стран и язык, культура играют большую роль в этом процессе. В настоящее время, каждый человек стремится владеть не только одним иностранным языком, но даже двумя или более. Владение иностранным языком открывает большие перспективы.

Поэтому широкое распространение получают различные языковые курсы, пособия по их изучению, и, конечно, электронные словари. Все словари предлагают пользователям свои ресурсы и функции, которые помогают слушателям повысить уровень владения языком. Но, как говорится в одной русской пословице — «никто не понимает ребенка, как его мать», и является причиной создания данной программы.

УНИВЕРСАЛЬНАЯ ПРОГРАММА ДЛЯ СОЗДАНИЯ СЛОВАРЕЙ И ИЗУЧЕНИЯ

Данная программа является мультиязыковой и предоставляет пользователям возможность создать любой свой собственной словарь и изучать новые слова с помощью слайдера при ее гибкой настройке.

Программа обладает следующими характеристиками:

  • универсальностью: программа позволяет создать любой словарь в зависимости от желания ученика;
  • бесплатностью: программа распространяется бесплатно
  • мультиязычностью: программа поддерживает много языков интерфейса поэтому перевод одного языка интерфейса на другой язык не требует никакого усилия;
  • быстродействием: база данных программы основана на Microsoft Access, что позволяет повысить скорость доступа к данным при большом размере базы;
  • простотой в использования: программа предоставляет простой интерфейс для работы;
  • гибкость настройки: удобство настройки демонстрации слайдов;
  • удобство: программа не требует установки и предоставляет удобный интерфейс;

Программа может выполнять следующие функции:

ü создавать новый словарь;

ü редактировать выделенный словарь;

ü добавлять новое слово по теме;

ü редактировать новое слово по теме;

ü удалять новое слово по теме;

ü показывать в слайде слова по теме;

ü настраивать поля слайда;

ü редактировать тему;

ü настраивать скорость слайда и язык интерфейса.

СТРУКТУРА ПРОГРАММЫ

База данных данной программы находится под управлением Microsoft Access, её структура показана на рисунке 1.

Рис. 1. Схема базы данных

Несмотря на простоту базы данных, она позволяет создать любой словарь и целые темы новых слов. Каждый словарь хранится в таблице и имеет до четырех полей, достаточных для описания любой темы, кроме этого, он обладает некоторыми темами, хранимыми в таблице . Новое слово, помечаемое индексами словаря и темы, помещаются в таблицу .

Программа имеет три формы, которые показаны на рис. 2.

Рис. 2. Структура программы

Все кнопки программы были уменьшены, но снабжены описанием.

ЗАКЛЮЧЕНИЕ

Разработанная программа достаточно проста, но при этом позволяет создать любой словарь. Программа, не может сравниться с программами известных производителей по запасу слов, но она имеет свои определенные особенности и распространяется бесплатно.

Одной из самых полезных программ на ПК и смартфоне в моем понимании является электронный словарь. В те стародавние времена, когда я учил иностранный язык, каждое слово приходилось искать в бумажном словаре. Эту тривиальную операцию я проделывал сотни раз, а некоторые зловредные слова приходилось смотреть снова и снова, так как я успевал забыть их значение. Как это было обидно! То ли дело сейчас, вжух и перевод перед глазами на экране монитора. История поиска, на случай, если искомое слово не перешло из области кратковременной памяти в долгосрочную.



Давайте своими силами создадим электронный словарь для программ StarDict / GoldenDict. Для этого может понадобится много, или мало человеко-часов, в зависимости от качества исходного материала.

Шаг первый: OCR

В отличие от альпинизма при оцифровке словаря самый тяжелый шаг, не последний а первый. Если вам придется проводить OCR бумажного словаря с выцветшими страницами, напечатанного слишком мелко, с различными артефактами небрежного использования, или на экзотическом языке, то даже FineReader не сильно поможет. На некоторых страницах разница в длительности времени между ручным набором текста и OCR с корректировкой ошибок ничтожна.


Советую сохранять все в простых текстовых файлах, так как продвинутый поиск и исправление ошибок, расстановка тэгов, преобразование сортировки и прочие операции с текстовым массивом невообразимо осуществлять с бинарным фалом .


На этом шаге важно определиться со структурой словарных статей. В самом простом случае будет всего два поля: ключ и значение . Этого достаточно, но если нужна подсветка различных элементов статей, то тогда потребуется все такие элементы определенным образом маркировать.


Самое время немного поговорить о форматах. Существует много форматов электронных словарей, вот их список.


Все форматы мы здесь разбирать не будем, так как большинство из них проприетарные. Нас интересуют открытые стандарты и открытое ПО.

Dictd

Возникший в эпоху, когда сетевые TCP/IP протоколы беспрепятственно плодились и размножались dictd сейчас представляет лишь археологический интерес. Это клиент серверный протокол, использующий TCP порт 2628, определен в RFC 2229 .


Исходный файл для словаря форматируется следующим образом.


:статья: объяснение XDXF

Ну все, завязываем с археологией и переходим к словарным форматам и программам годным для использования IRL.


XDXF имеет все преимущества и недостатки XML формата, каковым и является. Весь синтаксис формата и примеры можно обозреть .


Скелет словарного файла выгладит следующим образом, состоит из 2-х частей: meta_info и lexicon .


Вся информация про словарь: название, автор и пр. статья 1 статья 2 статья 3 статья 4 ...

Тем не менее возможно и кое-какое и разметка файла словаря, однако не идет ни в какое сравнение с XDXF .


a 1\n2\n3 b 4\\5\n6 c 789

Формат определяет символ переноса строки \n , в том случае, когда статья разбита на параграфы.

Шаг второй: корректировка

После первого шага скорее всего будут десятки, а то и сотни орфографических, грамматических и всяких прочих ошибок, странных символов и прочих артефактов OCR.


Особенность словарей в том, что проверка орфографии нужна одновременно по двум языкам. Даже сейчас в 2018-м удивительно мало текстовых редакторов и даже офисных пакетов умеют это нехитрое действие выполнять.



:setlocal spell spelllang=en,ru

для проверки орфографии по двум словарям, в данном случае русском и английском. Далее список граблей.

  • Сортировка текста работает абы как для не латинских локалей, особенно плохо там, где написание буквы требует более одного символа, как армянская ու = ո + ւ . Необходимо в таких случаях самостоятельно сортировать список слов с помощью простенького Perl, или иного скрипта.
  • Поиск по шаблону также может работать неожиданно для некоторых локалей, даже если сам текст и консоль в UTF-8.
  • При оцифровке печатного словаря нужно быть готовым не только к ошибкам оцифровки, но и ошибкам в самом печатном словаре. Их там может содержаться немало!
  • Если название статьи пишется заглавными, то возможно следует перевести при оцифровке в нижний регистр. Не все буквы имеют символы в верхнем регистре, собственно не для всех локалей даже есть верхний регистр.
Шаг третий: компиляция словаря

Для формата XDXF , как уже было сказано, этот шаг не требуется. Просто запихнуть файл в папку /usr/share/goldendict , где программа подхватит его.


Для TSV файла, используется утилита stardict-editor , поставляемого с набором инструментов .



На выходе программа создает следующие файлы, наподобие древнего Dict.

  • somedict.ifo
  • somedict.idx либо somedict.idx.gz
  • somedict.dict либо somedict.dict.dz
  • somedict.syn (optional)
  • Файлы копируются в каталог /ysr/share/stardict/dic и на этом все.


    P. S. Для мобильной платформы Android программа GoldenDict внезапно стал платной, однако в интернет сети все еще можно найти последнюю бесплатную версию программы.

    Недавно я писал в цикле статей о том, какие существую способы изучения иностранных слов. В частности, самый популярный способ – . Напомню его суть. Берем стопку карточек небольшого размера (например, в виде визитки), на одной стороне пишем само слово, на другом – его перевод на необходимый язык. Стараемся запомнить слова, перемешиваем карточки, вспоминаем переводы и так далее, пока не запомним все слова из стопки.

    Автоматизировать и значительно расширить возможности данного способа поможет Интернет, а точнее интересный сервис по изучению иностранных слов — WordSteps.com . Вы спросите — как? Рассказываю подробнее.В основе WordSteps лежит набор тематических словарей, позволяющих изучать слова на 9ти различных языках: английском, французском, немецком, испанском, китайском, японском, итальянском, португальском и русском. Пользователи могут создавать свои словари, либо пользоваться словарями других участников сервиса.

    Например, вы решили создать свой набор слов. Процедура ввода слов максимально автоматизирована. Вы вводите слово, встроенный сервис Google Translate тут же предлагает подходящий перевод. Помимо этого для английских слов транскрипция прописывается автоматически. Большинство слов озвучивается носителями языка. Составили словарик и получаем доступ к 6ти упражнениям, в том числе одному из основных: “Карточки слов”. Правда в исполнении сервиса WordSteps это упражнение имеет несколько больше возможностей, чем слово перевод. Во-первых, вы можете включить режим подсказки. Во-вторых, ведется полная статистика правильных и неправильных вариантов ответа. Статистика сохраняется в профиле учащегося и позволяет отслеживать прогресс пополнения словарного запаса.

    Вы также можете воспользоваться готовыми наборами, которые были созданы другими пользователями системы. Лучшие словари отбираются путем голосования.

    На самом деле, карточки слов – это только малая доля тех возможностей, которые предоставляет сервис для запоминания слов. Идея WordSteps заключается в возможности максимально быстро и качественно учить новые слова. Для этого проект предлагает воспользоваться бесплатным мобильным приложением WordSteps Mobile Client . Вы сможете скачивать словари с сайта и учить слова в дороге с помощью 5ти доступных упражнений.

    Разработчики также предлагаю попробовать в деле утилиту WordSteps Reader , суть которой заключается в возможности переводить неизвестные слова при чтении текстов и тут же формировать из них слова и загружать на сайт. Далее, заходим в свой профиль и учим слова из текстов уже знакомыми нам упражнениями.

    В общем, если у вас проблемы с запоминанием слов или надоела постоянная зубрежка, WordSteps поможет разнообразить обучение и улучшить качество запоминания иностранных слов.

    Excel для Office 365 Word для Office 365 Outlook для Office 365 PowerPoint для Office 365 Publisher для Office 365 Access для Office 365 Word для Office 365 для Mac Visio Online Plan 2 Word для Интернета Visio профессиональный 2019 Visio стандартный 2019 Visio профессиональный 2016 Visio стандартный 2016 Visio профессиональный 2013 Visio 2013 Visio 2010 Visio стандартный 2010 Visio 2007 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Access 2019 OneNote 2013 OneNote 2010 Project профессиональный 2019 Excel 2016 Word 2019 для Mac Word 2016 Outlook 2016 PowerPoint 2016 Publisher 2016 Access 2016 Project профессиональный 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Access 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 Access 2010 Publisher 2010 Project 2010 Excel 2007 Word 2007 Outlook 2007 PowerPoint 2007 Publisher 2007 Access 2007 Project 2007 Word 2016 для Mac SharePoint Designer 2010 Office 2010 Project Online Desktop Client Project профессиональный 2013 Project стандартный 2010 Project стандартный 2013 Project стандартный 2016 Project стандартный 2019 Меньше

    Важно: Когда вы добавляете слово в настраиваемый словарь в одном приложении Office, оно становится доступным при проверке орфографии во всех приложениях Office.

    Все пользовательские словари управляются с помощью диалогового окна " Вспомогательные словари ", и в этом диалоговом окне должны быть включены любые вспомогательные словари (выбраны). Выполните указанные ниже действия, чтобы открыть диалоговое окно, а затем выберите определенную задачу.

    Открытие диалогового окна "Вспомогательные словари"

    Откройте параметры проверки правописания:

    • В большинстве программ Office: перейдите в раздел > Параметры файлов > проверки правописания .

      В Outlook: выберите файл > параметры > почта > проверки орфографии и автозамены >.

    Убедитесь, что флажок Предлагать только из основного словаря снят.

    Выберите Вспомогательные словари .

    Вы получаете список всех словарей, вверху которого указан словарь по умолчанию.

    Добавление, изменение и удаление слов в настраиваемом словаре

    Примечание: Чтобы быстро добавить слово в словарь, щелкните слово в документе правой кнопкой мыши и выберите команду Добавить в словарь . Слово добавляется в словарь по умолчанию.

    Если вы хотите, чтобы этот вспомогательный словарь был словарем по умолчанию, в котором будут сохранены новые слова, ознакомьтесь со статьей .

    Чтобы получить дополнительные сведения, выберите заголовки ниже.

    Добавление слов в настраиваемый словарь, используемый по умолчанию, при проверке орфографии

    При проверке орфографии можно добавлять слова, помеченные как написанные с ошибкой, в настраиваемый словарь, который используется по умолчанию. Чтобы изменить вспомогательный словарь по умолчанию, в который добавляются эти слова, ознакомьтесь с разписанием "Изменение настраиваемого словаря, в который добавляет слова средство проверки орфографии".

      Во время автоматической проверки орфографии и грамматики щелкните правой кнопкой мыши слово, подчеркнутое красной волнистой линией, и выберите команду Добавить в словарь .

      При запуске средства проверки правописания нажмите кнопку Добавить или Добавить в словарь для помеченного слова.

    Примечание: Если кнопка Добавить в словарь недоступна, убедитесь, что настраиваемый словарь выбран в диалоговом окне . Сведения о том, как выбрать словарь, см. в разделе .

    Дополнительные сведения см. в статье Проверка орфографии и грамматики .

    Изменение настраиваемого словаря, в который средство проверки орфографии добавляет слова


    Примечание: Во время редактирования настраиваемого словаря Word прекращает проверку правописания при вводе. Когда вы закончите изменение настраиваемого словаря, если хотите, чтобы Word продолжил проверку правописания при вводе, перейдите к диалоговому окну грамматика & , показанному на этапе 2, и установите флажок Проверять орфографию при вводе .

    Использование настраиваемых словарей

    Откройте диалоговое окно Вспомогательные словари

    В окне Вспомогательные словари установите флажки для всех настраиваемых словарей, которые хотите использовать, а затем нажмите кнопку ОК .

    Создание настраиваемого словаря

    Откройте диалоговое окно Вспомогательные словари , выполнив указанные выше действия.

    Нажмите Создать .

  • Сохранить .
  • Если вы хотите использовать новый словарь для другого языка, то после выбора этого словаря в диалоговом окне Вспомогательные словари выберите язык в списке Язык .

    Добавление существующего настраиваемого словаря

    Вспомогательные словари содержит список имеющихся настраиваемых словарей, которые Word может использовать при проверке орфографии. Если нужный словарь (например, купленный у сторонней компании) установлен на компьютере, но отсутствует в окне Вспомогательные словари , его можно туда добавить.

    Откройте диалоговое окно Вспомогательные словари , выполнив указанные выше действия.

  • Добавить .
  • Перейдите в папку, в которой находится нужный вам настраиваемый словарь, и дважды щелкните файл словаря.

    Дополнительные справочные сведения об установке словарей сторонних компаний см. в инструкциях по установке этих словарей.

    Изменение языка, связанного с настраиваемым словарем

    По умолчанию при создании нового вспомогательного словаря программа задает словарь для всех языков , а это значит, что словарь используется при проверке орфографии в тексте на любом языке. Однако вы можете связать настраиваемый словарь с определенным языком, чтобы программа использовала словарь только при проверке орфографии в тексте на определенном языке.

    Откройте диалоговое окно Вспомогательные словари , выполнив указанные выше действия.

    В диалоговом окне Вспомогательные словари выберите словарь, который хотите изменить.

    В списке Язык выберите язык, для которого собираетесь использовать словарь.

    Изменение используемого по умолчанию настраиваемого словаря, в который добавляет слова средство проверки орфографии

    При проверке орфографии в документе можно добавлять слова, помеченные как написанные с ошибкой, в настраиваемый словарь. Настраиваемый словарь по умолчанию - это словарь, в который Microsoft Word добавляет при этом слова.

    Откройте диалоговое окно Вспомогательные словари , выполнив указанные выше действия.

    В окне Правописание выберите словарь в поле "Вспомогательный словарь".

    Закройте диалоговое окно Правописание & .

    Примечание: Если там только один словарь, он должен быть словарем по умолчанию. В этом случае кнопка недоступна.

    При следующей проверке орфографии программа будет использовать выбранные настраиваемые словари по умолчанию.

    Если слово написано неправильно, вы можете щелкнуть его правой кнопкой мыши и проигнорировать его. Однако слово не добавляется в словарь и помечается в следующий раз, когда вы будете использоватьВеб-приложение Word.

    См. также

    Дополнительные сведения можно найти в статье правописание в Word

    Примечание: Эта страница переведена автоматически, поэтому ее текст может содержать неточности и грамматические ошибки. Для нас важно, чтобы эта статья была вам полезна. Была ли информация полезной? Для удобства также приводим ссылку на оригинал (на английском языке).

    — генератор словарей с паролями, в которых можно определить стандартную или заданную кодировку. Crunch может создать список слов со всевозможными комбинациями и перестановками в соответствии с заданными критериями. Данные, которые выводит crunch, могут быть отображены на экране, сохранены в файл или переданы в другую программу.

    Это очень гибкая программа по генерации словарей.

    Генерация паролей с Hashcat и maskprocessor

    Если у вас не работает Hashcat (она требует установку драйверов видеокарты), то вы можете использовать программу maskprocessor .

    Maskprocessor — это высокопроизводительный генератор слов (словарей), упакованный в отдельный исполняемый файл, в котором можно настроить символы для каждой позиции.

    Использование maskprocessor:

    Maskprocessor [опции]... маска

    Маска составляется из встроенного набора символов и (или) пользовательского набора символов.

    Встроенные наборы символов:

    L = abcdefghijklmnopqrstuvwxyz ?u = ABCDEFGHIJKLMNOPQRSTUVWXYZ ?d = 0123456789 ?s = !"#$%&"()*+,-./:;?@[\]^_`{|}~ ?a = ?l?u?d?s ?b = 0x00 - 0xff

    Все символы, кроме тех, которые означает набор (?l , ?u , ?d и т.д.) попадают в пароль без изменения.

    Если вы хотите составить словарь, который содержит пароли из шести цифр:

    Maskprocessor ?d?d?d?d?d?d

    Если вы хотите, чтобы в четырёх символьных паролях чередовались большие и маленькие буквы:

    Maskprocessor ?u?l?u?l

    Пароль начинается со слова voro, затем идут четыре цифры, а затем два больших буквы:

    Maskprocessor voro?d?d?d?d?u?u

    Пользовательские наборы символов:

    1, --custom-charset1=CS Пользовательские наборы символов -2, --custom-charset2=CS Пример: -3, --custom-charset3=CS --custom-charset1=?dabcdef -4, --custom-charset4=CS устанавливает для?1 символы 0123456789abcdef

    К примеру, в первой позиции должны быть цифры от 1 до 3, во второй позиции буквы AbCd, в третьей позиции любая цифра или маленькая буква, а последними двумя символами должны быть большие буквы:

    Maskprocessor -1 123 -2 AbCd -3 ?l?d ?1?2?3?u?u

    • -1 123 - первый пользовательский набор символов, включающий символы 123
    • -2 AbCd - второй пользовательский набор символов, включающий символы AbCd
    • -3 ?l?d - третий пользовательский набор символов, включающий символы?l?d, т.е. все маленькие буквы и цифры
    • ?1?2?3?u?u - маска, составленная из пользовательских и стандартных наборов символов.

    Дополнительные полезные опции:

    * Приращение: -i, --increment=ЧИСЛО:ЧИСЛО Включить режим приращения. Первое ЧИСЛО=начало, второе ЧИСЛО=конец Пример: -i 4:8 интересующая длинна 4-8 (включая) * Разное: --combinations Посчитать количество комбинаций --hex-charset Предположить, что символы даны в шестнадцатеричном виде -q, --seq-max=ЧИСЛО Максимальное число одинаковых повторяющиеся символов -r, --occurrence-max=ЧИСЛО Максимальное число вхождения одного символа * Ресурсы: -s, --start-at=СЛОВО Начать с конкретной позиции -l, --stop-at=СЛОВО Закончить на конкретной позиции * Файлы: -o, --output-file=ФАЙЛ Файл вывода

    Hashcat VS maskprocessor

    Хотя, в целом, для генерации паролей maskprocessor и Hashcat являются взаимозаменяемыми, нужно помнить, что для выбора режима брутфорса/атаки по маске нужно указывать опцию -a 3 (поскольку Hashcat поддерживает различные режимы атаки, а не только по маске). Также нужно использовать опцию --stdout , которая означает показывать кандидаты в пароли (без взлома хеша).

    Hashcat не позволяет задать максимальное число одинаковых повторяющиеся символов, максимальное число вхождения одного символа, начать или закончить на конкретной позиции.

    С запуском Hashcat на Linux системах могут быть проблемы из-за необходимости иметь проприетарные драйвера.

    Приращение длины пароля делается другими опциями:

    Короткая / Длинная опция | Тип | Описание | Пример ==============================+======+===================================+======================= --increment-min | Числ | Начать прирост маски на X | --increment-min=4 --increment-max | Числ | Остановить прирост маски на X | --increment-max=8

    Заключение

    Crunch - очень гибкая программа для генерации словарей. Из минусов можно отметить некоторую запутанность назначения пользовательского набора символов, а также то, что пользовательские наборы символов перезаписывают стандартные наборы.

    Hashcat не имеет некоторых опций, связанных с регулированием количества повторяющихся символов в пароле.

  • (55.2%)
  • (RANDOM - 0.9%)
  • Поделиться