Проект Compreno, компании ABBYY революционно эфективный переводчик.
Голубятня: Чудо Compreno
Проект Compreno, над которым компания ABBYY корпит уже пятнадцать лет и выводит, дай бог, в этом году на стадию готового к потреблению продукта — это не новое, и тем более — не очередное событие.
www.computerra.ru/sgolub/663954
Автор: Сергей Голубицкий. 28 февраля 2012 года
Больше всего на свете мне хочется выделить тему сегодняшнего рассказа из потока рядовых событий IT, которыми заполняется информационное пространство моей колонки. Новые гаджеты — это замечательно. Новый удачный софт -бальзам на истерзанную душу пользователя. Проект Compreno, над которым компания ABBYY корпит уже 15 лет и выводит, дай бог, в этом году на стадию готового к потреблению продукта — это не новое, и тем более — не очередное событие.
Compreno — это полноценная, не имеющая аналогов в истории технологическая революция. Масштаб этой революции, значение ее для людей (именно для всех людей, а не только для любителей компьютеров) сопоставимы разве что с изобретением World Wide Web или электронной почты. Никак не меньше. Для наглядности можно перевести эту революцию в понятные материально-купюрные реалии: если ABBYY спокойно, без суеты коммерциализирует Compreno хотя бы в десятой части возможных ее практических применений, а затем выйдет на фондовый рынок, капитализация компании затмит всех кумиров сегодняшнего дня — от Apple, грамотно и стильно эксплуатирующего весьма и весьма посредственные в технологическом отношении решения, до Google, умудряющегося заводить в тупик охапками большую часть собственных перспективных начинаний.
Впрочем, довольно авансов и эмоций (хотя завсегдатаев Голубятен ни тем, ни другим давно не удивишь ☺ — пора представить Compreno во всем его величии. Начну с лапидарного компендиума: Compreno — это технология перевода любого человеческого языка на универсальный язык понятий. Соответственно, Compreno включает в себя и сам этот универсальный язык понятий, который ABBYY 15 лет (тайком ☺ разрабатывала в своих исследовательских лабораториях.
Результат ошеломляет: Универсальная Семантическая Иерархия (УСИ) — ядро языка понятий — насчитывает сегодня 60 тысяч элементов в универсальном разделе когнитивной модели, 80 тысяч — в русском разделе, и 90 тысяч — в английском! Ничего даже отдаленного в мире не существует.
Перспективы, которые открывает Compreno, безбрежны и разнообразны:
— компьютеризированный перевод текста с любого языка на любой на качественном уровне, несопоставимым со всеми распространенными сегодня системами перевода;
— полноценный интеллектуальный поиск без специализированного синтаксиса запросов (Поиск по смыслу, извлечение фактов и связей между объектами поиска/мониторинга; мониторинг компаний и персоналий и построение аналитических отчетов на основе параметров разного типа и др.);
системы искусственного интеллекта самых разнообразных профилей и применений;
— автоматическое распознавание речи;
— классификация документов и поиск похожих документов по смыслу;
— анализ тональности в мониторинге;
— реферирование и аннотирование (написание краткого содержания длинных документов)
и это только начало.
За пару дней до своей индийской зимовки я встретился с Татьяной Даниэлян, заместителем директора по лингвистическим технологиям компании ABBYY, и Сергеем Андреевым, генеральным директором и президентом группы компаний ABBYY и на протяжении полных двух часов сидел, широко разинув рот и охая от восторга по мере того, как в мое сознание вливались подробности революционного проекта, подкрепленные полноценной демонстрацией действующего прототипа движков машинного перевода и системы интеллектуального поиска.
Все то время, что Сергей и Татьяна, сами едва сдерживая восторг от собственных достижений, стягивали завесу тайны с Compreno, меня не покидало чувство того, что я участвую в каком-то акте добровольного промышленного шпионажа. Согласитесь, масштаб проекта ошеломляет: 15 лет интенсивной работы сотен людей, 50 миллионов долларов собственных инвестиций, совсем недавно усиленных сколковским грантом в 475 миллионов рублей. Вся компьютерная мощь головного офиса ABBYY (а он, поверьте на слово, ошеломляет: 6 этажей 7-этажногоогромного П-образного здания) в любую свободную минуту задействована для просчетов, необходимых для отладки и совершенствования Compreno, в первую очередь УСИ.
Впрочем, шпионаж — это лишь в моей голове, поскольку, разумеется, беседа наша состоялась в момент, когда Abbyy вышла на финишную прямую и была готова раскрыть миру свои карты.
Подробности Compreno я донесу читателям со слов Сергея Андреева и Татьяны Даниэлян — не потому, что не доверяю собственным суждениям, а потому что рассказ у обоих получился гладким и содержательным, зачем же плодить сущности?
Начало разработки Compreno пришлось на 90е годы, когда в арсенале ABBYY (в те годы — еще BIT Software) уже числилось два ледокола: словари Lingvo и программа для распознавания текста FineReader. Продукты продавались по всему миру, были хитами и приносили стабильную прибыль — манна небесная для романтических проектов вроде Compreno, стресс которых не пережил бы ни один сторонний инвестор (вкладывать миллионы долларов в нечто совершенно революционное да к тому же и с неизвестными перспективами? а вдруг ничего не получится? нет уж увольте!).
ABBYY обошлась без чужих денег и это спасло Compreno, позволив довести до победного конца проект со столь колоссальными материальными и людскими затратами.
Успех обеспечил и правильный изначальный выбор направления для разработки системы автоматического перевода. В 90-е в мире правила одна королева — Rule-Based Translation Model, классическая модель перевода, основанная на ограниченном наборе готовых правил для некоторой пары языков. Одна из проблем RBTM — в накоплении все новых и новых правил, которые в какой-то момент просто начинают конфликтовать между собой. Анализируя предложение, мы можем применить разные комплекты правил, при этом машине неведомы приоритеты. Перевод, основанный на RBTM, как правило, не озабочен полным синтаксическим анализом: вместо него предложение делится на фреймы, на которые затем интерполируют существующие в системе правила для получения перевода. RBMT системы не учитывают семантику.
В начале XXI века усилиями Google мир подсел на иглу нового алгоритма перевода — так называемой статистической модели. Основа СМ — наличие обширной базы разнонаправленных переводов. Мы задаем статистическому движку предложение для перевода, он ищет в базе данных как в словаре варианты уже существующих переводов аналогичного текста и после незначительных изменений выдает вполне приличный результат.
Изменения не самые существенные. Предположим нам нужно перевести предложение «в комнате стоит красный стул», а в статистической базе уже есть переведенная фраза «в комнате стоит зеленый стол» — решение элементарно: берется уже существующий шаблон перевода и новые слова просто заменяются по словарю.
Поскольку в СМ используются уже готовые человеческие переводы заведомо высокого качества, то на выходе получается весьма недурственный результат, ибо для осуществления перевода не нужно погружаться в синтаксис, специфику фразеологии конкретного языка и проч.
Все замечательно, однако, лишь до тех пор, пока дело не касается переводов в направлениях с так называемым низким покрытием (скажем, каким-нибудь, румынско-русским или тайско-венгерским).
Где брать аналоги? По словам Сергея Андреева опасность подстерегает также при уходе в предметные области на массовых направлениях, потому что параллельных текстов становится сильно меньше, чем в бытовой и разговорной тематике. Сочетание ухода в предметную область и не самого массового направления перевода приводит к слабым результатам. Скажем, IT. Казалось бы, какие сложности могут возникнуть у машинного перевода с текстом на тему информационных технологий? В самом деле — никаких, если мы занимаемся русско-английским переводом. Зато они тут же возникнут на русско-французской ниве! Статистическая база в этом направлении чрезвычайно скудная и лакуны возникают на каждом шагу.
Выход в рамках СМ для подобных ситуаций найден лишь паллиативный: работая с языками / темами низкого покрытия в качестве посредника используется английский язык. То есть сперва делается перевод с русского на английский, а затем уже с английского на, скажем, румынский, или тайский. В результате получается очень заметное снижение качества перевода.
Самое печальное, что проблема с плотностью покрытия в рамках СМ никак не решается принципиально. Единственный выход: нанять сотни тысяч переводчиков и заставить их заполнять лакуны по всем направлениям с низким статистическим покрытием. Как вы понимаете, никто это делать не сможет и не будет.
Помимо сложностей с низкой плотностью переводов по направлениям, выпадающим из узкого мейнстрима, у СМ еще множество мелких изъянов. Например, статистическая модель совершенно убого справляется с переводами имен собственных. Многие помнят о переводе Ющенко, как Януковича, а России как Канады. Отрицание (частичка «не») — это очень сложное препятствие. Частичку «не» можно правильно позиционировать в результате лингвистического анализа текста, а СМ таковым не занимается. В результате предложения, содержащие отрицание, часто переводятся движками на статистической модели с точностью до наоборот.
Как бы там ни было, ABBYY изначально отказалась от Rule Based Translation Model и замахнулась на систему компьютерного перевода нового поколения. Надо сказать, что придумывать особо ничего не требовалось. Универсальный язык понятий существует в структурной лингвистике в виде давней и несбыточной мечты еще со времен Людвига Витгенштейна. Даже Наум Хомский в своих ранних трудах лишь углублял существующую утопию.
Проект Compreno исходил из трех основополагающих посылок:
— использование качественного и бескомпромиссного синтаксического анализа.
— создание универсальной когнитивной модели языка, возможность которой определяется аксиомой о том, что люди, хоть и живут в разных условиях и говорят на разных языках, однако в массе своей мыслят одинаково. Формы выражения мысли разные, а вот понятийный аппарат совпадает.
— автоматизированное корпусное дообучение — лингвистические описания верифицируются и дополняются на основании статистической обработки корпусных данных.
Исходя из этих посылок была сформулирована идея Универсальной Семантической Иерархии (УСИ), способной описывать явления от общего к частному. На составление этой иерархии у ABBYY и ушло 15 лет. Получилось то, что вы уже знаете: только на сегодняшний день 70 тысяч понятий в универсальной части когнитивной модели, более 80 тысяч — в русской, более 90 — в английской.
Алгоритм машинного перевода, основанного на УСИ, выглядит следующим образом:
— Лексический анализ текста (выделение слов, знаков препинания, цифр и прочих текстовых единиц);
— Морфологический анализ (определение грамматических характеристик лексем);
— Синтаксический анализ (установление структуры предложения);
— Семантический анализ (выявление выражаемого значения в системе языка);
— Синтез из универсальной семантической структуры предложения на выходном языке.
В результате подбор слов для перевода осуществляется не напрямую из первого языка, а из понятийного набора, который, условно говоря, «висит» на той же ветке универсального семантического дерева, но только уже со стороны второго языка.
Поскольку модель УСИ сквозная, нижестоящие элементы системы по иерархии наследуют признаки вышестоящих элементов. Это простое, казалось бы, обстоятельство позволяет добиваться беспрецедентной точности машинного перевода, поскольку каждое слово из переводимого предложения описывается максимальным набором понятийных эквивалентов, причем не только видового, но и родовых качеств на всех уровнях смысловой иерархии.
В УСИ предусмотрены взаимосвязи между элементами структуры, относящимися к разным классам, и эти связи также структурированы и формализированы, что позволяет выполнять многоуровневый понятийный анализ текста, также повышающий качество перевода.
В процессе создания УСИ разработчикам открылись неожиданные грани использования системы: помимо машинного перевода язык УСИ можно использовать в интеллектуальных смысловых поисках и, возможно, автоматическом распознавании речи на новом качественном уровне, который достигается за счет глубокой интеграции и взаимопроникновения синтаксиса и семантики в модели универсальной семантической иерархии.
На альтернативных направлениях возникают, конечно, и свои сложности. Скажем, сегодня самым узким местом для глобального применения семантико-синтаксического анализа в массовых поисковых системах выступают очень высокие требования к компьютерным мощностям, необходимым для индексации информационных массивов на понятийном уровне. Требования эти несоизмеримо выше, чем при существующих формах традиционной индексации. Впрочем, уже сегодня методика семантико-синтаксического анализа может эффективно применяться (и применяется ABBYY — видел полностью функциональный прототип поискового движка собственными глазами) для более целенаправленного и узкого поиска в закрытых корпоративных системах.
Мировых аналогов у Compreno сегодня нет, хотя в некоторых университетах и ведутся разработки в аналогичных направления. Однако фора в 15 лет, задействованные огромные человеческие ресурсы и материальные затраты позволяют надеяться, что ABBYY таки сумеет застолбить для себя эксклюзивное место первопроходца. На руку компании играет и то обстоятельство, что последние 10 лет подавляющая масса исследований в мире велась в русле статистической модели машинного перевода.
За теоретическим введением в Compreno последовало более чем часовое погружение в демонстрацию работы движка компьютерного перевода, основанного на УСИ. Я сидел в одном из конференц-залов офиса ABBYY и непрестанно протирал глаза, все еще до конца не веря в услышанное и увиденного.
Теперь пользуюсь разрешением и демонстрирую читателям сравнение переводов, выданных Compreno и статистическим переводчиком (каким — гостеприимные хозяева просили не называть, но думаю, не маленькие и сами догадаетесь ☺
Не сомневаюсь, что для любого человека, знающего толк в переводах, это сравнение откроет новую вселенную. Вот работа статистического переводчика (разумеется, предложения подобранны специально «поддых», поскольку бьют в самые слабые места статистической модели перевода).
Это, господа, просто другой космос, другой уровень понимания текста. Это — революция!
Смотрел я на это, слушал внимательно и, похоже, начал улавливать тайный смысл (шуточного) мотивационного плаката, висящего в одном из офисных коридоров ABBYY:
www.rsdn.ru/forum/flame.comp/4640462.flat.aspx
Дмитрий, попробуйте перевести рекламу сэндвичей со свининой на арабский язык, для примера...
>на арабский язык, для примера...
--------------------------------------------
Семантическая матрица будет идентичной для многих языков, т.к. свинина и консервы распространена очень широко. Вот с мозгами живой мартышки в эвенкийском будет посложнее, но даже здесь семантическая матрица будет идентичной. Самое же сложное, что приходит на вскидку, жаренная саранча — у народов крайнего севера просто нет ничего близкого, входящего в питательный рацион.
И так, у нас есть обобщение (слово), которое в себя включает ряд объектов, и есть аналогичное слово в другом языке, которое имеет много общих с этим словом объектов, но есть и другие. Так вот, чтоб понять, годиться ли это слово в данном случае для перевода, надо выяснить, какой именно объект оно подразумевает (входящий в множество первого слова или нет). Объекты это и есть универсальный язык, и они самые низкоуровневые, а вот слова это уже более высокая степень иерархии. Так вот, в каждом языке своя иерархия, поэтому для каждого языка нужно свое иерархическое древо, и не более того.
>языка нужно свое иерархическое древо
----------------------------------
Это не так. Базовые семантики универсальны и едины во всех языках. Семантики более высоко уровня возникают на пересечении существующих + новый образ. Уникальными могут быть только биосферные семантики, т.к. они строго локальны.
Это из родимой википедии...
далеко не все эти цвета есть в других языках
--------------------------------------------------
Мыслим ли набор перекрывающий все языки?
====================================
Кроме того, поскольку они все могут относиться к одному реальному цвету
--------------------------------------------------------------
Они не относятся к реальному цвету. Они относятся к устойчивым ассоциациям с цветом...Это несколько разное...
«Они относятся к устойчивым ассоциациям с цветом...» — И это в том числе, но тогда правильнее будет сказать, что с определенной цветовой гаммой, различной для каждого синонима.
«Это несколько разное.» — Путаем теплое с мягким?
---------------------------------------------------
Так он и не совпадает. Всегда цвета несколько разные... Хоть и написанно в техпаспорте что «цвет валюта»...
-------------------------
Уже существующих семантических единиц
>Слова отражают реальность
-------------------------------
Слова ничего не отражают, а кодируют. Почему не отражают? Ну вот что может отражать оранжевый, малиновый, шипучий, мягкий(цвет) или острый (вкус) ? Слово всего лишь набор звуков не имеющий ровно никакого, в данном случае, отношения к обозначаемому феномену. Такие слова эквивалентны семантическому базису, т.е. смыслу не сводимому к пересечению других смыслов. Вкус, рука, я, еда, жизнь — их невозможно описать другими словами, т.е. Перечислить качества. Можно только дать функциональное определение. А вот орех описывается: кругловато-вытянутый, плод, съедобный, растение, коричневый когда спелый, твердая оболочка и т.д.
«Слова ничего не отражают, а кодируют.» — это было бы смешно, если бы не было так печально. www.galactic.org.ua/clovo/p-o9993.htm
Что же они кодируют, можно поинтересоваться? Без ответа на этот вопрос я не могу обсуждать все то, что Вы пишите, так же, как не в состоянии обсуждать сепульки в сепулькарии.
-------------------------------
Так я строго на поставленные и отвечаю. Я не телепат что б отвечать на подуманные вопросы. «Два пишем, три на ум пошло» :)
>Что же они кодируют...?
-------------------------------
Говоря технологическим сленгом, образы поступающие на вход анализатора. Что это за образы, какими алгоритмами и на основании чего сформированы — мы, люди, не знаем. Предполагается что интегральный образ детекторной сети(набор рецепторов+периферийные узлы) на базе нервной системы. На выходе анализатора получается СИ — Семантический (смысловой) Инвариант (уникальная ключевая метка) образа.После этого, СИ линкуется к рецепторным образам (вот они как раз отражение, но не объекта, а взаимодействия) и получает метки в коммуникативных системах. С алгоритмами формирования меток тоже пока больше тумана, чем ясности. Метка в акустической, вербальной коммуникативной системе — слово. Коммуникативных систем 3: акустическая, визуальная, тактильная. Каждая из них может имееть несколько кодирующих подсистем. Например в визуальной есть цветовая(живопись) и формальная, т.е. основанная на форме(мимика, жесты, танцы и т.п.).
Значит слова кодируют образы, следовательно образы это нечто базовое, а кодировка вторична. Как формируются образы и что они из себя представляют до конца не известно, я правильно понимаю? Но это же не значит, что мы не можем создать некий аналог этого образа, вполне удовлетворяющий систему перевода? Ну это как кварки в физике, их никто не обнаружил, однако их существование вытекает из свойств вещества, т.е. их изучили достаточно чтоб прогнозировать различные взаимодействия. Кстати, образ это и есть отражение реальности...
«Отражение взаимодействия» — у меня такое впечатление, чем больше терминов, тем меньше смысла. Скажите прямо, что мол декодировка сообщения не может быть выполнена идеально (т.е. мы не можем получить абсолютно те же образы, что и кодирующий), поскольку декодирующее устройство отличается от кодирующего. Это будет всем ясно и понятно, и главное несет намного больше смысловой нагрузки.
---------------------------------------
Не образы, а смыслы. Собственно именно ими мы в основном и оперируем. И проблема с декодированием заключается в том, что общим местом для всех людей является участок к которому у нас нет прямого доступа. Адекватная интерпретация слов или образов (не совсем уместное слово, но пока оставлю и так) в смысл сегодня без телепатии невозможна. Спасают косвенные методы а ля черного ящика, которые позволяют с достаточной степенью достоверности строить семантические структуры. Но... человеку на формирование связанной семантической структуры надо 15-25 лет и это при учете того, что она создается не на пустом месте, а есть еще и этнический банк, который мы осваиваем в раннем детстве. Автоматизировать это чрезвычайно сложно ... алгоритм-то неизвестен. Вот и придется делать эту работу в основном в ручном режиме — минимум 30 человеко*лет. Одно радует. Работа разовая.
>образ это и есть отражение реальности
----------------------------------------------
на рецепторах получить образ действительности не получится. Если остаться на уровне образности, то это скорее слепок от соприкосновения с действительностью. Примерно как в притче о 3-х слепых мудрецах и слоне. Имея коллекцию таких слепков можно попробовать построить модель действительности, достоверность которой будет определяться разнообразием и полнотой коллекции. Ведь образ — это описание самой действительности, пусть и в рамках нашего формализма, но полное, включая то, до чего не дотягиваются наши рецепторы. И по этой причине образ нам и не доступен.
Ну если на бытовом, то тогда понятно: смысл это есть определенная последовательность образов. Например как в басне, сначала рисуются образы, а потом раскрывается их смысл (для тупых).
Для того и пишут, что отражение реальности, а не реальность, поскольку отражение не может быть идеальным. Т.е. наш мозг имеет некую копию реальности, но не идентичную самой реальности. Вот и все, что подразумевают под термином отражение реальности. А каким образом это отражение получено, это уже детали.
Образ и смысл существенно различаются. Примерно как 2 яблока на столе и цифра 2 в тетради.
«Поэтому у вас и непонятность образуется.» — У меня нет непонятностей, с чего Вы это взяли? Непонятности они сплошь и рядом у Вас, например, на мой вопрос, что же кодируют слова, Вы ответили: «Говоря технологическим сленгом, образы поступающие на вход анализатора.» — а после этого имеете наглость утверждать, что этого не писали.
«Это уже ваша интерпретация моих слов, попытка понять меня с помощью своего устава (системы знаний).» — Т.е. попытка Вас понять не эффективна, поскольку смысла в вашей писанине нет? Это следует из того, что же Вы сами написали.
«Образ и смысл существенно различаются. Примерно как 2 яблока на столе и цифра 2 в тетради.» — Ничего не понимаю, в примере сравниваются два образа и не более того.
Объясняю на примере с цифрой два и двумя яблоками. Цифра два это лишь символ, как и два яблока. Смысл символа в контексте, т.е. он приобретает смысл только благодаря другим образам. Как. например. всего два яблока на дереве или два яблока на столе у учителя. Так же и цифра два в математическом примере имеет один смысл, а при нумерации совершенно другой. У образов или слов кодирующих образы нет самостоятельного смысла, вот и все.
Не Вы первый, не Вы последний, не переживайте. У меня таких целая коллекция. И главное, все так искусно делали вид, что понимают о чем пишут, что я даже верил местами.
Что бы язвительные комментарии задевали человека, нужно быть или близким человеку, или иметь высокий авторитет в его глазах. Вы же со своим задиристым гребешком забавны. :)
«С кем не бывает, — сказал ежик слезая с кактуса»:D
ru.wikipedia.org/wiki/Апресян,_Юрий_Дереникович
Я работал в крупной организации с руководителями высокого уровня, и могу Вам с уверенностью сказать, что действительно ХОРОШИЙ секретарь — это большая редкость и ценность. Тут и коммуникации с клиентами, и «чувство момента», и многое другое :-)
>и многое другое
---------------------------------------------------
Навешав на спеца кучу задач, его можно сделать не просто редким, а уникальным. Что бы не быть голословным:
работник ЖЭК, обычный мужчина с прямыми руками и сообразительный, легко выполнит обязанности электрика, сантехника, столяра, плотника, сварщика. Добавим сюда непьющий, не раскручивает клиентов на допработы, не подворовывает. Думаете не возможно? Можно, но попробуй найти такого да еще на 30 т.р.:D
Должностные обязанности базового секретаря вполне реализуемы на современном программно-аппаратном уровне. Уровень референта, на который часто загоняют хороших секретарей, правда пока не тянем.
Был у меня хороший соавтор Сарлык, он окончил ВГИК киносценарный, но его в Москве на м. Кузьминки местный молодняк убил в 2002 году, когда он встрял в их местные разборки. Он лучше меня мог писать. Идеи и все эпизоды были мои, а он очень грамотно прописывал всё. Царство ему небесное.
А чичас я сирота казанская, без сколько либо грамотного соавтора.
----------------------------------------
:) И сказал дон Кихот дон Кихоту, ты поймешь меня с полуслову...
Вреж, дальше можете не продолжать. С вами, мне по крайней мере, все ясно. :D
Мужчина или женщина — не имеет значения. Главное что б был комплементарен. Вот тогда идет не хилый резонанс. А игра в одни ворота меня лично не восторгает.
В каком-то смысле все мои серафимчики могут стать ядром полноценных фильмов.
>почти подростками.
------------------------------------
Это вы не про Мошковский самиздат часом? ;)
Ну тогда попробуйте самиздат Мошковского/Там народ часто в соавторстве пишет. Вдобавок там и издатели с прочими пасутся.:)
-------------------------------------------
Серьёзно? Ой, а ссылку эту не кинете мне, Дмитрий? Мне заниматся этим в тыщу раз интереснее, чем заниматься реформой всей этой погрязшей в нравственном компосте цивилизации. Мавр сделал своё дело, написал им теорию. Теперь Мавр хочет расслабиться. Хотите берите, хотите нет, вашим же детям будет только хуже, у меня их всё равно нет. А вот фантазировать, придумывать такие сногшибательные эффектные идеи, которые больше никто никогда не сможет придумать, это моя страсть. Тут хочется по Пушкински сказать, а я да я, ай да ....! :)
Там внутри них, как будто совсем нет воздуха, нет пространства, нет лёгкости. Как будто там у них спёртый чулан внутри которого тяжёлый тупой свинец или сырой кусок мяса из которог идёт тяжёлый пар. Да, именно так это ошущаеться. С такими тяжело общатся. У творческих людей нутро ошущается иначе. Поэтому я всегда инстинктивно окружал себя творческими молодыми полными энергии людьми, летунами. Видимо, чтобы не задохнутся от людей.
Это я пишу вам, чтобы узнать ваши подобные ощущения. Ведь вы много раз писали, что почти идентично чувствуете многое.
Наймите редакторов, что ли, миллиардеры, мля... :-)
Есть и хорошие вещи, конечно. Про MS можно почитать тут:
www.vb-net.ru/AbsoluteEvil/index.htm
Падения гарантированы!
Легко — дерьмовые у них средства разработки (Visual Studio),
--------------------------------------------
Но вота беда... Пользуются этим дерьмом. А почему?
ТО же самое — спрашивать, почему пользуются антивирусом Касперского. Продукт -конченное г..но (и всегда им было), однако же выставили ценник выше среднего (и даже выше гораздо более качественных аналогов типа Nod,Symantec и Avast), каждый день клепают какие-то обновления базы, и новые юзеры ведутся!
Студией я и сам пользуюсь, как и виндой, и не перестаю удивляться халатности разработчиков и порой откровенной враждебности к пользователю. Вы не считаете, что софт должен помогать пользователю, предугадывая его желания? А теперь попробуйте настроить стандартный сервис Routing and Remote Access на машине с двумя сетевыми картами и внешним интернетом для раздачи трафика и роутинга пакетов. Или, допустим, вы — разрабочик, пялитесь в монитор весь рабочий день. В старой студии попытайтесь увеличить шрифт скроллом. Получилось? Не выбешивает?
почему пользуются антивирусом Касперского. Продукт -конченное г..но (и всегда им было), однако же выставили ценник выше среднего (и даже выше гораздо более качественных аналогов типа Nod,Symantec и Avast)
------------------------------------------------------
Да, тут согласен, продукт отстой выше всякого возможного. Я б из всего предпочёл авиру. Даж фри вариант может дать фору всему. Ну или нортон, то который «360» Для дома я имею в виду...
Ну вот у меня монитор 30 от Эппл, разрешение native 2560x1600.
Шрифт в 6-й студии во весь экран выглядит достаточно мелким.
чисто с точки зрения нового пользовательского интерфейса.
с 2008 стараюсь работать по минимуму, потому как мне он неудобен.
+ там функциональность большинства старых программ/компонент особо никто не улучшал
Я любил шуструю Оперу, но видимо винд специально нацелен на то, чтобы устроить мне пакости если я воспользуюсь не его браузером. Как в плену. Вынужден его дерьмовым браузером пользоватся.
--------------------------------------------------
От ничё не понимаю... Вроде опрера работает как родная... Щас правда с хромиума пишу....
Ms начиная с Висты как раз и требует обязательной цифровой подписи дров, чтобы в режиме ядра непонятные поделки не крутились...
---------------------------------------------
Само по себе прально это. Потому как поделка в режиме ядра верный бсод вооще то...
Без объяснения причин. Так что кластерные технологии нам помогут, и виртуализация.
Да, какой-то конфликт по железу. у нас не брэндовое пока :-(
Это не реклама Мака, это пример из практики... И он не единичный.
Недаром же MS не гарантирует работу Win в mission-critical и life-crilical приложениях, это не операционная система реального времени...
Там, где нужен гарантированный отклик ОС за оговоренный квант времени...
Если ко мне вдруг обратится такой клиент, будут кодить для RTOS на сях или асме...
Дело в том, что все боятся брать на себя риск. Засудят ведь потом, если случись что...
-------------------------------------------------
О! Всегда находят козла отпущения. И никогда того кого следовало бы... Кстать так ничего нового не взлетит... И не случится ИИ... Если не рисковать...
===========================================
Анатолий Алексеев 13 мая, 01:39
Может, и так, однако такое редко практикуют...
------------------------------------------------------------
Какое? Гашение резонансов на гиперзвуках? Без этого эти вещи не летают...
Нет, так нельзя сказать.ядра вынесены из нулевого кольца в user mode :-)
-----------------------------------------------------------
Нэт... Но идеология по выносу в user mode всего «неблагонадёжного» кода получила развитие. И кажется стабильность налицо... Вы говорили что там у вас падает винда? Так хоть память бы ночку протестировали. Как правило изза неё падения...
-----------------------------------
Всё же от руки можно?
Это, вообще говоря, кусочек из области ИИ..
-----------------------------------------------------
Скорее из области жёстких алгоритмов....
«
--— реферирование и аннотирование (написание краткого содержания длинных документов)...
---— автоматизированное корпусное дообучение — лингвистические описания верифицируются и дополняются на основании статистической обработки корпусных данных.
----------------
— Семантический анализ (выявление выражаемого значения в системе языка);
— Синтез из универсальной семантической структуры предложения на выходном языке»
Александр, всё развивается, мне нравится что они делают.. Работа, конечно, огромная, она сродни обучению хорошего аспиранта ..
Работа, конечно, огромная, она сродни обучению хорошего аспиранта ..
--------------------------------------------------------------------------------
Уникально.... Из фольклору я полагаю? :)))
То что они делают возможно и полезно, но не более чем файеридер... То есть «ничего нового»... Скорее всего, потому почему я сказал. Но может я ошибаюсь. Информации нет что б решить чем именно занимаются...
Преодолим ли языковой барьер Википедии?
17 мая 2012 года, 13:41 | Текст: Дмитрий Целиков | Послушать эту новость
Вам когда-нибудь приходило в голову, что Википедия содержит огромное количество нужной информации на незнакомых вам языках, к тому же изложенной с позиций иной культуры?
Дабы преодолеть языковой барьер, Брент Хехт из Северо-Западного университета (США) и его коллеги создали «Омнипедию» — ПО, позволяющее просматривать статьи на одну и ту же тему из 25 языковых разделов Википедии.
Так носители дравидийского языка малаялам праздновали десятитысячную статью в своём разделе Википедии. (Фото Abhishek Jacob.)
Это не просто ещё один автоматический переводчик. Программа анализирует ссылки на боковой панели, указывающие на иноязычные статьи той же тематики. Система проходит по этим ссылкам и пытается понять, какие темы универсальны в данной области, а какие — специфичны для каждого языка, после чего отображает их все.
Этот метод анализа не назовёшь надёжным: например, на многих языках «Теория заговора» связана со статьёй об НЛО, а в испанском разделе такая ссылка отсутствует, хотя сама статья об НЛО есть. Поэтому приходится применять дополнительные алгоритмы, которые охотятся за такими недостающими звеньями.
«Омнипедия» отображает каждую тему, найденную в конкретной статье, в виде круговой диаграммы, разделённой на цветные сегменты: каждый из них представляет язык, на котором обсуждается тема. Щелчок по кругу открывает соответствующий фрагмент из статьи, и он автоматически переводится с помощью Bing Translator.
Разработчики попросили 27 добровольцев с различным знанием языков протестировать программу. Говорят, многие были поражены тем, какого количества информации лишена английская Википедия и насколько полны другие языковые разделы — например, японская статья о регги.
«Омнипедия» была представлена в Остине (штат Техас, США) на Конференции по вопросам человеческого фактора в компьютерных системах.
В каком то смысле Comprendro и является почти Искуственным Интеллектом.
-----------------------------------------------------------------------------------------------
Нет. Он мог являтся только слоржной программой. Представь некоторое так сказать «непрерывное поле соответствий», в данном случае языковые соответствия. Для алгоритма они все эти соответствия-состояния недостижимы. Достижима некоторая «сетка» в этом непрерывном поле. А то что ИИ может и должно покрывать все эти состояния... Ну не знаю понятино я или не очень... :)
Помнишь ту гермионную сеть? Её формирование не заданно изначально (можно так сказать, так как «информион» таки существует). И поэтому не факт что результат можнет быфть описан конечным алгоритмом... А это признак ИИ...
Так ведь некая размытость вообше свойственно любой информации.
----------------------------------------------------------------------------------------------------
«Размытость» свойственна не информации а комплексу информация-наблюдатель... :)
По гуглеарз я иногда спускаюсь в Москву....
---------------------------------------------------------------------------------------
Тут сделано получе....