Перейти на домашнюю страницу Андрея Герасимова Сайт Андрея Герасимова
Разговоры об Америке
www.gerasimov.org
 
 ПравилаПравила FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 

Google boosts book digitization by capturing reCAPTCHA

 
Начать новую тему   Ответить на тему    Список форумов Разговоры об Америке -> Про компы
Предыдущая тема :: Следующая тема  
Автор Сообщение
Andrew
Главный трепач


Зарегистрирован: 01.03.2003
Сообщения: 10421
Откуда: Иркутск, RU -> Los Angeles, US

СообщениеДобавлено: Четверг, Сентября 17, 2009 1:24am    Заголовок сообщения: Google boosts book digitization by capturing reCAPTCHA Ответить с цитатой

Google boosts book digitization by capturing reCAPTCHA

Выдержка из текста:
Цитата:

reCAPTCHA is an attempt to solve both problems at once. The service takes images of text that were not successfully processed by OCR programs, and repurposes them for use as CAPTCHAs, since they're already known to fool the sort of software that's used by botnets. If actual humans can decipher them, the results are fed back to the book digitization project, filling in the blanks in older texts.

И как после этого не любить Google? Молодцы, одним словом.
_________________
Андрей Герасимов
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
Hashish
Житель форума


Зарегистрирован: 06.03.2008
Сообщения: 1231

СообщениеДобавлено: Четверг, Сентября 17, 2009 2:23pm    Заголовок сообщения: Re: Google boosts book digitization by capturing reCAPTCHA Ответить с цитатой

Andrew писал(а):
И как после этого не любить Google? Молодцы, одним словом.
В каком месте они молодцы? Технология сделана в Карнеги-Мелон, реализована и эксплуатировалась года два там же. Была некоммерческой, стала сами-понимаете. Если только в смысле "молодцы, что имеют много денег и скупают всё", то да.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Andrew
Главный трепач


Зарегистрирован: 01.03.2003
Сообщения: 10421
Откуда: Иркутск, RU -> Los Angeles, US

СообщениеДобавлено: Четверг, Сентября 17, 2009 3:19pm    Заголовок сообщения: Re: Google boosts book digitization by capturing reCAPTCHA Ответить с цитатой

Молодцы в том, что теперь они ее будут применять для Google Books.
_________________
Андрей Герасимов
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
Slava
НЛО


Зарегистрирован: 10.03.2003
Сообщения: 4182
Откуда: at this moment Stamford CT

СообщениеДобавлено: Четверг, Сентября 17, 2009 11:51pm    Заголовок сообщения: Ответить с цитатой

Насколько мне кажется эта фишка использовалась многими сайтами бесплато. А что теперь будет? Гугля теперь будет со всех деньгу стричь?
_________________
Good judgment comes from expirience.
Expirience comes from bad judgment
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Andrew
Главный трепач


Зарегистрирован: 01.03.2003
Сообщения: 10421
Откуда: Иркутск, RU -> Los Angeles, US

СообщениеДобавлено: Пятница, Сентября 18, 2009 1:04am    Заголовок сообщения: Ответить с цитатой

Slava писал(а):
Насколько мне кажется эта фишка использовалась многими сайтами бесплато. А что теперь будет? Гугля теперь будет со всех деньгу стричь?

Ты новость не читал ведь? Улыбка
_________________
Андрей Герасимов
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
Slava
НЛО


Зарегистрирован: 10.03.2003
Сообщения: 4182
Откуда: at this moment Stamford CT

СообщениеДобавлено: Пятница, Сентября 18, 2009 3:42am    Заголовок сообщения: Ответить с цитатой

Andrew писал(а):
Slava писал(а):
Насколько мне кажется эта фишка использовалась многими сайтами бесплато. А что теперь будет? Гугля теперь будет со всех деньгу стричь?

Ты новость не читал ведь? Улыбка

НеаУлыбка
_________________
Good judgment comes from expirience.
Expirience comes from bad judgment
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Andrew
Главный трепач


Зарегистрирован: 01.03.2003
Сообщения: 10421
Откуда: Иркутск, RU -> Los Angeles, US

СообщениеДобавлено: Пятница, Сентября 18, 2009 4:16am    Заголовок сообщения: Ответить с цитатой

Про проект Google Books ведь знаешь? Так вот, некоторые отсканированные слова в книгах система распознавания "прочитать" не смогла. Такие непонятные системе слова теперь будут подсовываться пользователям, которые должны угадать капчу. Когда они угадают то, что на ней написано - система будет пускать пользователей туда, куда им нужно войти, а угаданное слово подшивать в систему (туда, где не было понятно, что это за слово).

Понятно, что там не все так просто и наверняка будет какая-нибудь система проверки (например, чтобы одно и то же слово угадали разные пользователи). Но идея использовать ее для Google Books, самой большой в мире электронной библиотеки, просто потрясающая.
_________________
Андрей Герасимов
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
Hashish
Житель форума


Зарегистрирован: 06.03.2008
Сообщения: 1231

СообщениеДобавлено: Пятница, Сентября 18, 2009 4:31pm    Заголовок сообщения: Ответить с цитатой

Andrew писал(а):
Но идея использовать ее для Google Books, самой большой в мире электронной библиотеки, просто потрясающая.
Ну да, превратить университетский проект в придаток своей "потрясающей" библиотеки, позволяющей просматривать по нескольку десятков страниц из книги. Едиснтвенная радость - поиск всё равно по всему тексту.

В каментах к новости один чел очень удачно заметил, что такое уже было, когда он люто задротствовал, вводя данные своей музыкальной коллекции в CDDB, которая была открытой и бесплатной в тот момент, а потом её купил Gracenote.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов Разговоры об Америке -> Про компы Часовой пояс: GMT
Страница 1 из 1

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2005 phpBB Group