Книги Google
-
История и цели Google Books
- Google Books — сервис от Google, выполняющий поиск по полному тексту книг и журналов.
- Книги предоставляются издателями, авторами и библиотечными партнерами.
- Google сотрудничает с издательствами журналов для оцифровки их архивов.
-
Процесс сканирования и оцифровки
- Google сканирует книги и преобразует их в текст с помощью OCR.
- Книги сканируются в специальных центрах, где операторы работают со скоростью до 6000 страниц в час.
- Сканированные изображения проходят три уровня обработки: устранение деформации, OCR и извлечение номеров страниц.
-
Уровни доступа и политика отказа
- Полный просмотр: книги в открытом доступе доступны для бесплатного скачивания.
- Предварительный просмотр: книги с разрешением доступны для ограниченного просмотра.
- Просмотр фрагмента: отображается две-три строки текста вокруг поискового запроса.
- Без предварительного просмотра: книги не были отсканированы, доступны только метаданные.
-
Критика и судебные разбирательства
- Google Books подверглась критике за возможные нарушения авторских прав.
- В 2005 году Google объявила политику отказа, позволяющую владельцам авторских прав исключать книги из проекта.
- В 2010 году Google заявила о намерении отсканировать все 130 миллионов различных названий.
-
Влияние на рынок и продажи
- Оцифровка книг Google Books привела к увеличению продаж физических версий книг.
- Google Books отображает исходные номера страниц для многих книг, но для некоторых недавних публикаций номера страниц не указываются.
-
Инновации и технологии
- Google разработала инновационную систему сканирования книг с использованием двух камер и инфракрасного света.
- Google отказалась от информации о цвете в пользу лучшего пространственного разрешения.
- Google потратила значительные ресурсы на разработку оптимальных методов сжатия для обеспечения доступа пользователей с низкой пропускной способностью.
-
Информация о книге
- Включает сведения о издании, карту частотных слов, оглавление
- Дополнительные материалы: резюме, отзывы, ссылки на другие тексты
-
Интерактивные возможности
- Экспорт библиографических данных и цитат
- Написание обзоров, добавление в библиотеку
- Возможность установки цены на скачивание
-
Программа просмотра Ngram
- Отображает частоту употребления слов в книжной коллекции
- Важна для историков и лингвистов
-
Проблемы с содержанием и критика
- Ошибки сканирования: нечитаемые страницы, перевернутые страницы
- Ошибки в метаданных: неправильное указание авторов и дат
- Языковые проблемы: непропорциональное внимание к английскому языку
-
Google Books против Google Scholar
- Google Books не содержит метаданных для идентификации статей
- Google Scholar запустил программу оцифровки старых журнальных статей
-
Партнеры библиотеки
- Библиотечный проект Google Books сканирует коллекции крупных научных библиотек
- Книги в общественном достоянии доступны для чтения или скачивания
- Книги, защищенные авторским правом, доступны для просмотра фрагментов
-
Первоначальные партнеры
- Гарвардский университет, библиотека Гарвардского университета
- Мичиганский университет, библиотека Мичиганского университета
- Нью-Йоркская публичная библиотека
- Оксфордский университет, Бодлианская библиотека
- Стэнфордский университет, библиотеки Стэнфордского университета
-
Дополнительные партнеры
- Австрийская национальная библиотека
- Баварская государственная библиотека
- Муниципальная библиотека Лиона
- Академический альянс «Большой десятки»
-
История проекта Google Books
- В 2002 году Google запустила проект «секретные книги»
- Основатели Google Сергей Брин и Ларри Пейдж предложили идею Google Books в 1996 году
- В 2003 году команда начала разработку высокоскоростного процесса сканирования
-
Расширение проекта
- В 2004 году Google объявила о расширении проекта Google Print Library
- В 2005 году Google изменила название сервиса на Google Book Search
- В 2006 году Google добавила кнопку «загрузить pdf» и новый интерфейс просмотра
-
Партнерства и достижения
- В 2006 году к проекту присоединились Калифорнийский университет, Мадридский университет Комплутенсе, Университет Висконсин-Мэдисон и другие
- В 2007 году к проекту присоединились Техасский университет в Остине, Баварская государственная библиотека, Университет Майсура и другие
- В 2008 году Google достигла отметки в 7 миллионов отсканированных книг
-
Юридические и технологические изменения
- В 2008 году достигнуто соглашение между Google и издательской индустрией
- В 2009 году Google запустила мобильную версию Google Book Search
- В 2010 году Google запустила магазин цифровых книг Google Editions
-
Текущие достижения
- В 2010 году Google отсканировал 12 миллионов книг
- В 2012 году Google достигла отметки в 15 миллионов отсканированных книг
-
История проекта Google Books
- В 2010 году Google объявила о намерении отсканировать все известные книги в течение десятилетия.
- В 2010 году был запущен сервис электронных книг Google Editions.
- В 2010 году запущена программа Ngram Viewer для анализа использования слов в книжной коллекции.
-
Судебные иски и соглашения
- В 2011 году Федеральный судья отклонил мировое соглашение между издательской индустрией и Google.
- В 2012 году Google отсканировал 20 миллионов книг и достиг соглашения с издателями.
- В 2013 году Google выиграла дело против Гильдии авторов, сославшись на добросовестное использование.
- В 2015 году Апелляционный суд поддержал Google, заявив, что компания не нарушала закон об авторском праве.
- В 2016 году Верховный суд США оставил решение суда низшей инстанции в силе.
-
Текущее состояние проекта
- Google Books продолжает сканирование книг, но темпы снизились.
- В 2017 году The Atlantic сообщила, что Google практически прекратил работу по сканированию.
- В апреле 2017 года Wired сообщил, что над проектом работает всего несколько сотрудников.
-
Юридические вопросы
- Google оцифровывала книги без разбора, что привело к судебным искам.
- В 2005 году авторы и издатели подали иск против Google за нарушение авторских прав.
- В 2015 году Google выиграла дело, сославшись на добросовестное использование.
-
Другие проекты и инициативы
- Проект «Гутенберг» оцифровывает и архивирует произведения культуры.
- Internet Archive оцифровывает более 1000 книг в день и копирует книги из Google Books.
- HathiTrust поддерживает цифровую библиотеку, включающую материалы Google и других источников.
- NDLI предоставляет бесплатный доступ к книгам на английском и индийском языках.
- Europeana содержит ссылки на 10 миллионов цифровых объектов.
- Gallica из Национальной библиотеки Франции содержит около 4 миллионов оцифрованных книг.