Обложка
О проекте  |  Новости сайта  |  Размещение рекламы 
Портал MEMBRANA: Люди. Идеи. Технологии.
•   Мировые новости

•   Форумы и дискуссии

•   Ярмарка идей
•   Клуб «Мембрана»

•   Фотогалереи

•   Стоп-кадры
Поиск по сайту



ЭВРИКА
ПЛАНЕТАРНЫЙ МАСШТАБ
ДЕЛО ТЕХНИКИ
ИГРА ВООБРАЖЕНИЯ
СЕТЕВОЕ ОКРУЖЕНИЕ
ЗДОРОВЫЙ ИНТЕРЕС
СЛОЖНО О ПРОСТОМ
БОЛЬШИЕ СВЯЗИ
СЕКРЕТ ФИРМЫ
СВОБОДА СЛОВА
КРУГЛЫЙ СТОЛ
ТЕХНОФЕТИШ
ИСПОРЧЕННЫЙ ТЕЛЕФОН
АКТУАЛЬНЫЕ ТЕМЫ
Тематический доступ к статьям

ПОДПИШИТЕСЬ
НА НАШУ РАССЫЛКУ!



Ежедневно в Вашем ящике:
новые статьи, лента новостей,
новые темы форумов.

МИРОВЫЕ НОВОСТИ

Открыт возврат пещерных скорпионов к СолнцуОткрыт возврат пещерных скорпионов к Солнцу
(12 марта 2010)
Обнаружено ещё одно вкусовое ощущение  (12 марта 2010)

Северные олени переросли биологические часы  (12 марта 2010)

Физики научили металл перемешивать сам себя  (12 марта 2010)

Японцы создали углеводородный сверхпроводник  (12 марта 2010)

На Титане открыт карстовый рельеф  (12 марта 2010)

Доказана связь деятельности человека и формы крыльев птиц  (12 марта 2010)

Тёмная энергия и ОТО получили подтверждение вселенского масштаба  (11 марта 2010)

Стресс изменяет половые предпочтения мужчин  (11 марта 2010)

Предложен новый метод ускорения зарядки батарей  (11 марта 2010)



ВАШЕ МНЕНИЕ

Согласитесь ли Вы жить вообще без сна, если вдруг появится такая возможность?

С радостью, чтобы не терять время37%
Да, но ненадолго, на пробу25%
Ни за что, я люблю смотреть сны21%
Конечно! Я и так почти не сплю9%
Нет, я хочу, наоборот, спать больше6%
Ещё чего, мне не по душе ночная жизнь2%


Всего ответов:12208



Тысячеязычный поиск картинок объединяет смыслы в матрицу
Теперь людям не придётся перелопачивать словари, чтобы понять, как найти в Сети нужную картинку, подписанную на неизвестном им и редком языке (фото с сайта smi.ucr.edu).
Тысячеязычный поиск картинок объединяет смыслы в матрицу

18 сентября 2007
membrana

•  Обсуждение
•  Отправить
•  Распечатать

Вписывая в поисковике картинок Google слово "ключ" мы со вздохом начинаем пролистывать тысячи и тысячи изображений, которые показывают нам всё что угодно, но только не маленький родничок среди зелёной травы. Значение такого слова как "ключ" даже человек может понять только по контексту. Что же с этой проблемой делать машине? Кажется, учёные нашли решение.

Нам-то, русским, конечно, легче. В нашем великом и могучем есть хотя бы слово "родник", а вот в английском есть только один перевод слова "ключ" — "spring" (а это слово также обозначает и время года, и металлическую спираль).

Вот и собрались программисты да лингвисты в центре имени Тьюринга (Turing Center), что в университете Вашингтона (University of Washington), и разработали программное обеспечение для межъязыкового поиска картинок, которое внедрили его во Всемирную паутину.

Новый многоязычный поисковик PanImages, недавно представленный на 11-м саммите машинного перевода (Machine Translation Summit XI) в Дании, позволит людям искать картинки в Интернете с помощью более чем тысячи языков (правда, в базе сейчас порядка двух с половиной миллионов слов из более чем 300 языков, но это – не окончательный вариант системы).

PanImages добавляет новые слова в матрицу, которая позволяет перевести любое слово между двумя любыми языками в базе (иллюстрация University of Washington).

PanImages добавляет новые слова в матрицу, которая позволяет перевести любое слово между двумя любыми языками в базе (иллюстрация University of Washington).

Такие поисковики, как Google, ищут картинки по набранному слову, выявляя его в подписях к рисунку и окружающем тексте, а ещё — в названии файла. Но так как пользователь вписывает слово на своём родном языке, результаты поиска весьма ограничены. А ведь картинки это не текстовые документы, которые пользователь не в состоянии понять из-за незнания языка.

PanImages (греческий префикс "пан" означает общий, всеобщий) автоматически переводит слово в строке поиска и сортирует результаты в группы по языкам, ранжируя по количеству найденных картинок. Затем пользователь выбирает нужный ему язык и просматривает найденные посредством Google картинки и фото из онлайновой базы Flickr (окно браузера делится на две части).

Такое вот фото холодильника (всего одно) представит вам Google, если вы в строке поиска впишите "холодильник" по-зулусски ("ifriji") (фото с сайта wikimedia.org).

Такое вот фото холодильника (всего одно) представит вам Google, если вы в строке поиска впишите "холодильник" по-зулусски ("ifriji") (фото с сайта wikimedia.org).

PanImages призван в первую очередь помочь тем людям, которые разговаривают на языках, мало представленных в Интернете, но он также облегчит поиск необходимых картинок и тем людям, которые хотят найти именно то, что они ищут.

Так, в случае обычного поиска англичанин не найдёт картинки, помеченные тегами в китайских иероглифах, а датчанин – с английскими подписями.

"Google (один из лучших мировых сервисов поиска на данный момент) предоставит вам не более десятка картинок, если вы введёте слово, скажем, на зулусском языке. В то же время PanImages сгенерирует более 472 тысяч вариантов картинок", — говорит Орен Этциони (Oren Etzioni), профессор информатики и конструирования вычислительной техники Вашингтонского университета, который также руководит центром Тьюринга и возглавляет команду, работающую над PanImages.

"Интернет становится всё более доступным, и не только в индустриальных странах. В Сети появляются люди, которые говорят не только на английском, французском и китайском языках", — добавляет Этциони.

Но и пользователи, говорящие на "основных" языках, извлекут пользу из нового продукта. Ведь многие слова имеют несколько значений и, как следствие, плодятся результаты поиска.

А PanImages предоставит вам такой вот список, из которого вы выберете, на какой язык вы хотите перевести слово "холодильник" для поиска картинки и, соответственно, список этих самых кадров и рисунков (иллюстрация с сайта panimages.org).

А PanImages предоставит вам такой вот список, из которого вы выберете, на какой язык вы хотите перевести слово "холодильник" для поиска картинки и, соответственно, список этих самых кадров и рисунков (иллюстрация с сайта panimages.org).

Как мы уже говорили, например, вы ищете картинки, соответствующие английскому слову "spring". Обычный поисковик предоставит вашему вниманию и идиллические картины зеленеющих лугов, и металлические пружины, и бьющий из-под земли ключ.

Если же вам нужны изображения только металлической пружины, то, воспользовавшись PanImages, вы можете выбрать более точное французское значение этого слова "ressort".

Благодаря Орену Этциони нам теперь не грозят трудности перевода (фото University of Washington).

Благодаря Орену Этциони нам теперь не грозят трудности перевода (фото University of Washington).

В другом случае, вписывая в строку поисковика "rectangular bar", вам нужно будет выбрать русское "брусок", чтобы не терять время на фотографии напивающихся у барной стойки друзей.

Проведённые тесты малораспространённых языков показали, что PanImages выдаёт в среднем в 57 раз больше результатов, чем стандартный поиск по картинкам в Google. К тому же использование точных (на родном языке) формулировок позволяет увеличить количество отвечающих запросу картинок на первых 15 страницах на 75%.

"Мозги" PanImages создавались на основе 350 онлайн-словарей и нескольких онлайновых многоязычных вики-словарей (Wiktionary), которые пишутся добровольцами. Специальное программное обеспечение под названием TransGraph сканирует их для PanImages и с помощью своего алгоритма рассчитывает и проверяет, насколько точно то или иное слово соответствует заданному (по смыслу).

Затем TransGraph собирает полученные результаты в матрицу, которая даёт возможность пользователю ресурса переводить слова в немыслимых, казалось бы, комбинациях, например, с гуджарати на литовский. Подробности работы системы изложены здесь (PDF-документ, 600 килобайт).

Фрагмент TransGraph для двух значений английского слова "spring". Линии с цифрами 1 и 3 объединяют слова со значением "весна", линии 2 и 4 — со значением "пружина" (иллюстрация с сайта washington.edu).

Фрагмент TransGraph для двух значений английского слова "spring". Линии с цифрами 1 и 3 объединяют слова со значением "весна", линии 2 и 4 — со значением "пружина" (иллюстрация с сайта washington.edu).

База данных (и матрица, соответственно) постоянно пополняется как авторами, так и пользователями. Они могут добавлять как новые слова, так и их перевод на другие языки (все дополнения проверяются).

"Отличительной особенностью этого небывалого лексического ресурса является перевод слов на самые разные мировые языки. Нашей целью является внесение в базу данных всех языков, которые интересны людям", — говорит Этциони. Да, эту систему можно просто использовать в роли универсального словаря.

В общем, если у вас нет проблем с поиском картинок, и вы можете подобрать подходящую комбинацию слов абсолютно на любом языке, то PanImages вам не понадобится. Но таких полиглотов, как вы — мало (поздравляем!), так что авторы "Всеобщих картинок" надеются, что их ресурс всё же будет востребован, а для кого-то станет одним из самых необходимых.

•  Обсуждение •  Распечатать •  Отправить ссылку •  На обложку

ССЫЛКИ ПО ТЕМЕ

PixLogic — система логического поиска цифровых изображений
Доктор предлагает певческий поиск музыки
Google запустил поиск по программным кодам
Google начинает искать в книгах
Google положил глаз на домашние компьютеры
Technology Horizons: Lost in translation

СЕТЕВОЕ ОКРУЖЕНИЕ

Молитвомат обращается к Господу железным голосом (25 марта 2009)
Картинки и образы помогут найти смысл в Интернете (13 октября 2008)
Перчатка ощущений сделает людей честными и воспитанными (11 сентября 2008)
Поющий программист объединяет Европу в виртуальный хор (2 августа 2007)
Настоящие редиски найдут в Интернете лучшего огородника (21 ноября 2006)
Голубой мишка готовит детей к службе в ЦРУ (13 февраля 2006)
Не моргнув глазом: пользователи Сети оценивают сайты за доли секунды (16 января 2006)
В порядке вещей: наступает эра неодушевлённого Интернета (18 ноября 2005)
Фишки-такси загнали Лондон в игру-монополию (23 июня 2005)

ЧИТАЙТЕ СЕЙЧАС

Автомобиль Carpuccino пьёт кофе вёдрами
Двойная птица объединила петуха и курицу в одном теле
Хищное растение раскрылось туалетом для тупайи

ЧИТАЙТЕ ТАКЖЕ

Конь да Винчи получил шанс на огненное возрождение (9 марта 2010)
Древнейший кузен динозавров тянет их появление в глубины прошлого (5 марта 2010)
Ударим по рукам: интерфейс Skinput извлекает данные из кожи вон (4 марта 2010)
Вездесущий химикат угрожает сменой лягушачьего пола (4 марта 2010)
Терпеливая змея уплетала маленьких дино на завтрак (3 марта 2010)
Валлийцы желают разбудить на башне бронзового дракона (2 марта 2010)
Беспереходный транзистор ведёт микросхемы к новым масштабам (2 марта 2010)
Уловитель жестов примерил облик чёрного куба (1 марта 2010)
Донные бактерии построили себе ЛЭП для непрерывного питания (27 февраля 2010)
Компании-гиганты открыли тайную электростанцию в коробке (26 февраля 2010)
Вертолёты-пиксели развернут в небе трёхмерный дисплей (25 февраля 2010)
Алмазная проволока осветила путь к компьютеру будущего (24 февраля 2010)
Нановолоконные лампочки радуют глаз правильным светом (19 февраля 2010)
Антимоскитный лазер устроил звёздные войны в миниатюре (18 февраля 2010)
Беспроводное электричество поразило своих создателей (16 февраля 2010)
Ультракомпактные солнечные ячейки открыли новые горизонты техники (11 февраля 2010)
Второй Robonaut принял эстафету в надежде заменить человека (10 февраля 2010)
Samsung заинтересовался летающим отелем на водороде (9 февраля 2010)
Подводные газы оспорили авторство жизни у первичного супа (5 февраля 2010)
Учёные наладили связь с пациентом в вегетативном состоянии (4 февраля 2010)
Универсальный нанопринтер печатает картины ДНК-чернилами (3 февраля 2010)
Америка отказалась возвращать человека на Луну (2 февраля 2010)






MEMBRANA
Проект компании болоtov.ru
Информация о сайте
Интеллисайт На главную страницу  •
В начало страницы  •