Оглавление [Скрыть]
Программа просмотра Ngram в Google Книгах
-
Обзор Google Books Ngram Viewer
- Онлайн-инструмент для анализа частоты использования поисковых фраз в печатных источниках с 1500 по 2019 год.
- Поддерживает поиск на английском, китайском, французском, немецком, иврите, итальянском, русском и испанском языках.
- Включает специализированные разделы для американского и британского английского, а также английской художественной литературы.
-
История и разработка
- Google объединилась с исследователями из Гарварда для разработки программы в 2010 году.
- Программа была создана для количественных исследований в гуманитарных науках и содержала 500 миллиардов слов.
- Изначально была предназначена для ученых, но стала доступной для широкой аудитории.
-
Использование и ограничения
- Пользовательские запросы разделяются запятыми и ищутся как n-граммы.
- Ограничения на размер базы данных приводят к индексированию только совпадений в 40 и более книгах.
-
Критика и рекомендации
- Наборы данных Ngram Viewer критикуются за неточное распознавание текста и отсутствие метаданных.
- Предлагаются рекомендации по использованию данных для решения проблем с распознаванием текста и предвзятостью.
Полный текст статьи: