Проект Compreno, компании ABBYY революционно эфективный переводчик.

Голубятня: Чудо Compreno
Проект Compreno, над которым компания ABBYY корпит уже пятнадцать лет и выводит, дай бог, в этом году на стадию готового к потреблению продукта — это не новое, и тем более — не очередное событие.
www.computerra.ru/sgolub/663954
Автор: Сергей Голубицкий. 28 февраля 2012 года

Больше всего на свете мне хочется выделить тему сегодняшнего рассказа из потока рядовых событий IT, которыми заполняется информационное пространство моей колонки. Новые гаджеты — это замечательно. Новый удачный софт -бальзам на истерзанную душу пользователя. Проект Compreno, над которым компания ABBYY корпит уже 15 лет и выводит, дай бог, в этом году на стадию готового к потреблению продукта — это не новое, и тем более — не очередное событие.

Compreno — это полноценная, не имеющая аналогов в истории технологическая революция. Масштаб этой революции, значение ее для людей (именно для всех людей, а не только для любителей компьютеров) сопоставимы разве что с изобретением World Wide Web или электронной почты. Никак не меньше. Для наглядности можно перевести эту революцию в понятные материально-купюрные реалии: если ABBYY спокойно, без суеты коммерциализирует Compreno хотя бы в десятой части возможных ее практических применений, а затем выйдет на фондовый рынок, капитализация компании затмит всех кумиров сегодняшнего дня — от Apple, грамотно и стильно эксплуатирующего весьма и весьма посредственные в технологическом отношении решения, до Google, умудряющегося заводить в тупик охапками большую часть собственных перспективных начинаний.


Впрочем, довольно авансов и эмоций (хотя завсегдатаев Голубятен ни тем, ни другим давно не удивишь ☺ — пора представить Compreno во всем его величии. Начну с лапидарного компендиума: Compreno — это технология перевода любого человеческого языка на универсальный язык понятий. Соответственно, Compreno включает в себя и сам этот универсальный язык понятий, который ABBYY 15 лет (тайком ☺ разрабатывала в своих исследовательских лабораториях.

Результат ошеломляет: Универсальная Семантическая Иерархия (УСИ) — ядро языка понятий — насчитывает сегодня 60 тысяч элементов в универсальном разделе когнитивной модели, 80 тысяч — в русском разделе, и 90 тысяч — в английском! Ничего даже отдаленного в мире не существует.

Перспективы, которые открывает Compreno, безбрежны и разнообразны:

— компьютеризированный перевод текста с любого языка на любой на качественном уровне, несопоставимым со всеми распространенными сегодня системами перевода;

— полноценный интеллектуальный поиск без специализированного синтаксиса запросов (Поиск по смыслу, извлечение фактов и связей между объектами поиска/мониторинга; мониторинг компаний и персоналий и построение аналитических отчетов на основе параметров разного типа и др.);

системы искусственного интеллекта самых разнообразных профилей и применений;

— автоматическое распознавание речи;

— классификация документов и поиск похожих документов по смыслу;

— анализ тональности в мониторинге;

— реферирование и аннотирование (написание краткого содержания длинных документов)

и это только начало.

За пару дней до своей индийской зимовки я встретился с Татьяной Даниэлян, заместителем директора по лингвистическим технологиям компании ABBYY, и Сергеем Андреевым, генеральным директором и президентом группы компаний ABBYY и на протяжении полных двух часов сидел, широко разинув рот и охая от восторга по мере того, как в мое сознание вливались подробности революционного проекта, подкрепленные полноценной демонстрацией действующего прототипа движков машинного перевода и системы интеллектуального поиска.

Все то время, что Сергей и Татьяна, сами едва сдерживая восторг от собственных достижений, стягивали завесу тайны с Compreno, меня не покидало чувство того, что я участвую в каком-то акте добровольного промышленного шпионажа. Согласитесь, масштаб проекта ошеломляет: 15 лет интенсивной работы сотен людей, 50 миллионов долларов собственных инвестиций, совсем недавно усиленных сколковским грантом в 475 миллионов рублей. Вся компьютерная мощь головного офиса ABBYY (а он, поверьте на слово, ошеломляет: 6 этажей 7-этажногоогромного П-образного здания) в любую свободную минуту задействована для просчетов, необходимых для отладки и совершенствования Compreno, в первую очередь УСИ.

Впрочем, шпионаж — это лишь в моей голове, поскольку, разумеется, беседа наша состоялась в момент, когда Abbyy вышла на финишную прямую и была готова раскрыть миру свои карты.

Подробности Compreno я донесу читателям со слов Сергея Андреева и Татьяны Даниэлян — не потому, что не доверяю собственным суждениям, а потому что рассказ у обоих получился гладким и содержательным, зачем же плодить сущности?

Начало разработки Compreno пришлось на 90е годы, когда в арсенале ABBYY (в те годы — еще BIT Software) уже числилось два ледокола: словари Lingvo и программа для распознавания текста FineReader. Продукты продавались по всему миру, были хитами и приносили стабильную прибыль — манна небесная для романтических проектов вроде Compreno, стресс которых не пережил бы ни один сторонний инвестор (вкладывать миллионы долларов в нечто совершенно революционное да к тому же и с неизвестными перспективами? а вдруг ничего не получится? нет уж увольте!).

ABBYY обошлась без чужих денег и это спасло Compreno, позволив довести до победного конца проект со столь колоссальными материальными и людскими затратами.

Успех обеспечил и правильный изначальный выбор направления для разработки системы автоматического перевода. В 90-е в мире правила одна королева — Rule-Based Translation Model, классическая модель перевода, основанная на ограниченном наборе готовых правил для некоторой пары языков. Одна из проблем RBTM — в накоплении все новых и новых правил, которые в какой-то момент просто начинают конфликтовать между собой. Анализируя предложение, мы можем применить разные комплекты правил, при этом машине неведомы приоритеты. Перевод, основанный на RBTM, как правило, не озабочен полным синтаксическим анализом: вместо него предложение делится на фреймы, на которые затем интерполируют существующие в системе правила для получения перевода. RBMT системы не учитывают семантику.

В начале XXI века усилиями Google мир подсел на иглу нового алгоритма перевода — так называемой статистической модели. Основа СМ — наличие обширной базы разнонаправленных переводов. Мы задаем статистическому движку предложение для перевода, он ищет в базе данных как в словаре варианты уже существующих переводов аналогичного текста и после незначительных изменений выдает вполне приличный результат.

Изменения не самые существенные. Предположим нам нужно перевести предложение «в комнате стоит красный стул», а в статистической базе уже есть переведенная фраза «в комнате стоит зеленый стол» — решение элементарно: берется уже существующий шаблон перевода и новые слова просто заменяются по словарю.

Поскольку в СМ используются уже готовые человеческие переводы заведомо высокого качества, то на выходе получается весьма недурственный результат, ибо для осуществления перевода не нужно погружаться в синтаксис, специфику фразеологии конкретного языка и проч.

Все замечательно, однако, лишь до тех пор, пока дело не касается переводов в направлениях с так называемым низким покрытием (скажем, каким-нибудь, румынско-русским или тайско-венгерским).

Где брать аналоги? По словам Сергея Андреева опасность подстерегает также при уходе в предметные области на массовых направлениях, потому что параллельных текстов становится сильно меньше, чем в бытовой и разговорной тематике. Сочетание ухода в предметную область и не самого массового направления перевода приводит к слабым результатам. Скажем, IT. Казалось бы, какие сложности могут возникнуть у машинного перевода с текстом на тему информационных технологий? В самом деле — никаких, если мы занимаемся русско-английским переводом. Зато они тут же возникнут на русско-французской ниве! Статистическая база в этом направлении чрезвычайно скудная и лакуны возникают на каждом шагу.

Выход в рамках СМ для подобных ситуаций найден лишь паллиативный: работая с языками / темами низкого покрытия в качестве посредника используется английский язык. То есть сперва делается перевод с русского на английский, а затем уже с английского на, скажем, румынский, или тайский. В результате получается очень заметное снижение качества перевода.

Самое печальное, что проблема с плотностью покрытия в рамках СМ никак не решается принципиально. Единственный выход: нанять сотни тысяч переводчиков и заставить их заполнять лакуны по всем направлениям с низким статистическим покрытием. Как вы понимаете, никто это делать не сможет и не будет.

Помимо сложностей с низкой плотностью переводов по направлениям, выпадающим из узкого мейнстрима, у СМ еще множество мелких изъянов. Например, статистическая модель совершенно убого справляется с переводами имен собственных. Многие помнят о переводе Ющенко, как Януковича, а России как Канады. Отрицание (частичка «не») — это очень сложное препятствие. Частичку «не» можно правильно позиционировать в результате лингвистического анализа текста, а СМ таковым не занимается. В результате предложения, содержащие отрицание, часто переводятся движками на статистической модели с точностью до наоборот.

Как бы там ни было, ABBYY изначально отказалась от Rule Based Translation Model и замахнулась на систему компьютерного перевода нового поколения. Надо сказать, что придумывать особо ничего не требовалось. Универсальный язык понятий существует в структурной лингвистике в виде давней и несбыточной мечты еще со времен Людвига Витгенштейна. Даже Наум Хомский в своих ранних трудах лишь углублял существующую утопию.

Проект Compreno исходил из трех основополагающих посылок:

— использование качественного и бескомпромиссного синтаксического анализа.

— создание универсальной когнитивной модели языка, возможность которой определяется аксиомой о том, что люди, хоть и живут в разных условиях и говорят на разных языках, однако в массе своей мыслят одинаково. Формы выражения мысли разные, а вот понятийный аппарат совпадает.

— автоматизированное корпусное дообучение — лингвистические описания верифицируются и дополняются на основании статистической обработки корпусных данных.

Исходя из этих посылок была сформулирована идея Универсальной Семантической Иерархии (УСИ), способной описывать явления от общего к частному. На составление этой иерархии у ABBYY и ушло 15 лет. Получилось то, что вы уже знаете: только на сегодняшний день 70 тысяч понятий в универсальной части когнитивной модели, более 80 тысяч — в русской, более 90 — в английской.

Алгоритм машинного перевода, основанного на УСИ, выглядит следующим образом:

— Лексический анализ текста (выделение слов, знаков препинания, цифр и прочих текстовых единиц);

— Морфологический анализ (определение грамматических характеристик лексем);

— Синтаксический анализ (установление структуры предложения);

— Семантический анализ (выявление выражаемого значения в системе языка);

— Синтез из универсальной семантической структуры предложения на выходном языке.

В результате подбор слов для перевода осуществляется не напрямую из первого языка, а из понятийного набора, который, условно говоря, «висит» на той же ветке универсального семантического дерева, но только уже со стороны второго языка.

Поскольку модель УСИ сквозная, нижестоящие элементы системы по иерархии наследуют признаки вышестоящих элементов. Это простое, казалось бы, обстоятельство позволяет добиваться беспрецедентной точности машинного перевода, поскольку каждое слово из переводимого предложения описывается максимальным набором понятийных эквивалентов, причем не только видового, но и родовых качеств на всех уровнях смысловой иерархии.

В УСИ предусмотрены взаимосвязи между элементами структуры, относящимися к разным классам, и эти связи также структурированы и формализированы, что позволяет выполнять многоуровневый понятийный анализ текста, также повышающий качество перевода.

В процессе создания УСИ разработчикам открылись неожиданные грани использования системы: помимо машинного перевода язык УСИ можно использовать в интеллектуальных смысловых поисках и, возможно, автоматическом распознавании речи на новом качественном уровне, который достигается за счет глубокой интеграции и взаимопроникновения синтаксиса и семантики в модели универсальной семантической иерархии.

На альтернативных направлениях возникают, конечно, и свои сложности. Скажем, сегодня самым узким местом для глобального применения семантико-синтаксического анализа в массовых поисковых системах выступают очень высокие требования к компьютерным мощностям, необходимым для индексации информационных массивов на понятийном уровне. Требования эти несоизмеримо выше, чем при существующих формах традиционной индексации. Впрочем, уже сегодня методика семантико-синтаксического анализа может эффективно применяться (и применяется ABBYY — видел полностью функциональный прототип поискового движка собственными глазами) для более целенаправленного и узкого поиска в закрытых корпоративных системах.

Мировых аналогов у Compreno сегодня нет, хотя в некоторых университетах и ведутся разработки в аналогичных направления. Однако фора в 15 лет, задействованные огромные человеческие ресурсы и материальные затраты позволяют надеяться, что ABBYY таки сумеет застолбить для себя эксклюзивное место первопроходца. На руку компании играет и то обстоятельство, что последние 10 лет подавляющая масса исследований в мире велась в русле статистической модели машинного перевода.

За теоретическим введением в Compreno последовало более чем часовое погружение в демонстрацию работы движка компьютерного перевода, основанного на УСИ. Я сидел в одном из конференц-залов офиса ABBYY и непрестанно протирал глаза, все еще до конца не веря в услышанное и увиденного.

Теперь пользуюсь разрешением и демонстрирую читателям сравнение переводов, выданных Compreno и статистическим переводчиком (каким — гостеприимные хозяева просили не называть, но думаю, не маленькие и сами догадаетесь ☺

Не сомневаюсь, что для любого человека, знающего толк в переводах, это сравнение откроет новую вселенную. Вот работа статистического переводчика (разумеется, предложения подобранны специально «поддых», поскольку бьют в самые слабые места статистической модели перевода).

Это, господа, просто другой космос, другой уровень понимания текста. Это — революция!

Смотрел я на это, слушал внимательно и, похоже, начал улавливать тайный смысл (шуточного) мотивационного плаката, висящего в одном из офисных коридоров ABBYY:



  • Врэж Багратуни  12 мая, 05:59
    +1
    ОтветитьНравится
  • Сергей Скалба  12 мая, 08:09
    Как такое не может не нравиться?, хотя есть мнение:
    www.rsdn.ru/forum/flame.comp/4640462.flat.aspx
    ОтветитьНравится
  • Врэж Багратуни  12 мая, 08:22
    Прочитал рекомендуемый вами форум. Ангажированости много и уже привычного российского примитивного злопыхательства. А то что у этой программы есть ещё пара конкурентов, в том числе из DAPRA меня сильно радует. Значит продукт получится более совершенный. Я очень нуждаюсь в такой программе. Буду готов даже прилично заплатить.
    ОтветитьНравится
  • Вреж, сильно не воспаряйте. Их заявления не сходятся. С одной стороны они заявляют об универсальном семантическом дереве, а с другой делят его на части: универсальная-английская-русская. Это что за семантический базис «еда», что он будет разным в русском и английском? Да, существуют культурологические инварианты, но их никак не больше универсалий. Их многократно меньше. Однако они заявляют 70 000 универсалий и 170 000 инвариантов. Если посмотреть на те продукты, которые они продают, то там есть такая вещь как инструмент создания контекстных баз данных переводов. Вот это уже существенно ближе к истинному положению вещей с Компреме. С высокой степенью вероятности это промежуточный выхлоп разработки. В общем я ожидаю повторение ситуации с Единорогом от майкрософта.
    ОтветитьНравится
  • И еще одно соображение. Логика софтверных компаний такова, что когда продукт выходит на уровень альфаверсии (для крупных проектов это примерно еще 2-4 года разработки), чаще всего утекает в инет. Не его презентация, а сам продукт или часть функционала как минимум. Я ничего такого не видел и не слышал. Если б что-то появилось, то его декларируемое значение таково, что весь инет гудел бы как улей. Но ведь тишина (Голубицкий с мертвой Компьютеррой не в счет) . Даже более того, попытка конструктивного разговора на хабре была пресечена и сведена к банальной презентации на уровне деклараций.
    ОтветитьНравится
  • Врэж Багратуни  12 мая, 17:17
    А нельзя их принцип сочетать с гуглевским статистическим принципом? Что этому может помешать?
    ОтветитьНравится
  • «Это что за семантический базис «еда», что он будет разным в русском и английском»
    Дмитрий, попробуйте перевести рекламу сэндвичей со свининой на арабский язык, для примера...
    ОтветитьНравится
  • Думаю, Копрено пока нерабочий... А то, что Абби с гордостью показывает, конечно, хорошо, но... Взгляните на wordvis.com/, построенную на основе базы word.net.
    ОтветитьНравится
  • >попробуйте перевести рекламу сэндвичей со свининой
    >на арабский язык, для примера...
    --------------------------------------------
    Семантическая матрица будет идентичной для многих языков, т.к. свинина и консервы распространена очень широко. Вот с мозгами живой мартышки в эвенкийском будет посложнее, но даже здесь семантическая матрица будет идентичной. Самое же сложное, что приходит на вскидку, жаренная саранча — у народов крайнего севера просто нет ничего близкого, входящего в питательный рацион.
    ОтветитьНравится
  • Можно многое, а мешают деньги — их надо зарабатывать. Пока фэйсбук не перешел дорогу гуглу, он в своей лаборатории разрабатывал все мало мальски интересное не взирая на экономическую перспективу. Сейчас, судя по отголоскам, закручены все гайки, заглушенный все нерентабельные проекты и все вышли на стены цитадели на защиту корпорации добра.:)
    ОтветитьНравится
  • Я к тому, что мусульманам запрещено есть свинину :-)
    ОтветитьНравится
  • Есть, но не говорить ;)
    ОтветитьНравится
  • Сергей Шляхтов  13 мая, 01:40
    К сожалению смысл статьи не понят. Проблема в том, что мы обобщаем реальность, и именно в обобщении на различных языках есть проблема, а не в недостающих словах. Недостающие слова обычно заимствуют.
    И так, у нас есть обобщение (слово), которое в себя включает ряд объектов, и есть аналогичное слово в другом языке, которое имеет много общих с этим словом объектов, но есть и другие. Так вот, чтоб понять, годиться ли это слово в данном случае для перевода, надо выяснить, какой именно объект оно подразумевает (входящий в множество первого слова или нет). Объекты это и есть универсальный язык, и они самые низкоуровневые, а вот слова это уже более высокая степень иерархии. Так вот, в каждом языке своя иерархия, поэтому для каждого языка нужно свое иерархическое древо, и не более того.
    ОтветитьНравится
  • >в каждом языке своя иерархия, поэтому для каждого
    >языка нужно свое иерархическое древо
    ----------------------------------
    Это не так. Базовые семантики универсальны и едины во всех языках. Семантики более высоко уровня возникают на пересечении существующих + новый образ. Уникальными могут быть только биосферные семантики, т.к. они строго локальны.
    ОтветитьНравится
  • Врэж Багратуни  13 мая, 02:48
    Браво, Сергей. Вы правы. В статье на это даже сделан акцент, но этот акцент не был читателями здесь замечен.
    ОтветитьНравится
  • Сергей Шляхтов  13 мая, 03:01
    Чего пересечения? Слова отражают реальность, и как реальность пересекается мне не понятно. Хотя почему бы и нет, вот пересекся человек с автомобилем, возникла авария или водитель транспортного средства. Вполне такой новый образ, я правильно понял? Ну тогда получается, что пересечение может иметь бесконечное количество вариаций...
    ОтветитьНравится
  • Сергей Шляхтов  13 мая, 03:24
    Ладно, давайте так: есть слова синонимы, их смысл одинаков? Если нет, то в чем разница?
    ОтветитьНравится
  • «Каждый синоним имеет свой особый оттенок значения, отличающий его от других синонимов, например: красный — алый — багряный — багровый.»

    Это из родимой википедии...

    ОтветитьНравится
  • Синонимайзер. www.synonymizer.ru/ Можно поиграться чем отличаются...
    ОтветитьНравится
  • Сергей Шляхтов  13 мая, 04:07
    Ну раз так (ввязался помогать), покажи на данном пример, какое тут пересечение в данном примере. Это не может быть базовой семантикой, поскольку далеко не все эти цвета есть в других языках. Кроме того, поскольку они все могут относиться к одному реальному цвету, то хотелось бы узнать, чем таки слова отличаются (только не надо говорить, что там есть оттенки, которые специфичны только для каждого определения, и которые нельзя назвать сразу всеми словами-синонимами, поскольку тогда это будет утверждение моей правоты)?
    ОтветитьНравится
  • Сергей Шляхтов 13 мая, 04:07
    далеко не все эти цвета есть в других языках
    --------------------------------------------------

    Мыслим ли набор перекрывающий все языки?
    ====================================

    Кроме того, поскольку они все могут относиться к одному реальному цвету
    --------------------------------------------------------------

    Они не относятся к реальному цвету. Они относятся к устойчивым ассоциациям с цветом...Это несколько разное...

    ОтветитьНравится
  • Сергей Шляхтов  13 мая, 04:12
    К слову синоним синонимов не найдено...
    ОтветитьНравится
  • Ну на другие находит... :))
    ОтветитьНравится
  • Сергей Шляхтов  13 мая, 04:18
    «Они не относятся к реальному цвету.» — Это ты полициям расскажешь, когда у тебя записанный в техпаспорте цвет машины не будет совпадать с цветом машины.
    «Они относятся к устойчивым ассоциациям с цветом...» — И это в том числе, но тогда правильнее будет сказать, что с определенной цветовой гаммой, различной для каждого синонима.
    «Это несколько разное.» — Путаем теплое с мягким?
    ОтветитьНравится
  • Это ты полициям расскажешь, когда у тебя записанный в техпаспорте цвет машины не будет совпадать с цветом машины.
    ---------------------------------------------------

    Так он и не совпадает. Всегда цвета несколько разные... Хоть и написанно в техпаспорте что «цвет валюта»...

    ОтветитьНравится
  • >Чего пересечения?
    -------------------------
    Уже существующих семантических единиц

    >Слова отражают реальность
    -------------------------------
    Слова ничего не отражают, а кодируют. Почему не отражают? Ну вот что может отражать оранжевый, малиновый, шипучий, мягкий(цвет) или острый (вкус) ? Слово всего лишь набор звуков не имеющий ровно никакого, в данном случае, отношения к обозначаемому феномену. Такие слова эквивалентны семантическому базису, т.е. смыслу не сводимому к пересечению других смыслов. Вкус, рука, я, еда, жизнь — их невозможно описать другими словами, т.е. Перечислить качества. Можно только дать функциональное определение. А вот орех описывается: кругловато-вытянутый, плод, съедобный, растение, коричневый когда спелый, твердая оболочка и т.д.

    ОтветитьНравится
  • Сергей Шляхтов  13 мая, 12:12
    «Уже существующих семантических единиц» — так синонимы отличаются или нет? Зубы не надо заговаривать и читать мантры, я это тоже умею. Надо отвечать на поставленные вопросы.

    «Слова ничего не отражают, а кодируют.» — это было бы смешно, если бы не было так печально. www.galactic.org.ua/clovo/p-o9993.htm
    Что же они кодируют, можно поинтересоваться? Без ответа на этот вопрос я не могу обсуждать все то, что Вы пишите, так же, как не в состоянии обсуждать сепульки в сепулькарии.

    ОтветитьНравится
  • >Надо отвечать на поставленные вопросы.
    -------------------------------
    Так я строго на поставленные и отвечаю. Я не телепат что б отвечать на подуманные вопросы. «Два пишем, три на ум пошло» :)

    >Что же они кодируют...?
    -------------------------------
    Говоря технологическим сленгом, образы поступающие на вход анализатора. Что это за образы, какими алгоритмами и на основании чего сформированы — мы, люди, не знаем. Предполагается что интегральный образ детекторной сети(набор рецепторов+периферийные узлы) на базе нервной системы. На выходе анализатора получается СИ — Семантический (смысловой) Инвариант (уникальная ключевая метка) образа.После этого, СИ линкуется к рецепторным образам (вот они как раз отражение, но не объекта, а взаимодействия) и получает метки в коммуникативных системах. С алгоритмами формирования меток тоже пока больше тумана, чем ясности. Метка в акустической, вербальной коммуникативной системе — слово. Коммуникативных систем 3: акустическая, визуальная, тактильная. Каждая из них может имееть несколько кодирующих подсистем. Например в визуальной есть цветовая(живопись) и формальная, т.е. основанная на форме(мимика, жесты, танцы и т.п.).

    ОтветитьНравится
  • Сергей Шляхтов  13 мая, 15:26
    Ну и замечательно!
    Значит слова кодируют образы, следовательно образы это нечто базовое, а кодировка вторична. Как формируются образы и что они из себя представляют до конца не известно, я правильно понимаю? Но это же не значит, что мы не можем создать некий аналог этого образа, вполне удовлетворяющий систему перевода? Ну это как кварки в физике, их никто не обнаружил, однако их существование вытекает из свойств вещества, т.е. их изучили достаточно чтоб прогнозировать различные взаимодействия. Кстати, образ это и есть отражение реальности...
    «Отражение взаимодействия» — у меня такое впечатление, чем больше терминов, тем меньше смысла. Скажите прямо, что мол декодировка сообщения не может быть выполнена идеально (т.е. мы не можем получить абсолютно те же образы, что и кодирующий), поскольку декодирующее устройство отличается от кодирующего. Это будет всем ясно и понятно, и главное несет намного больше смысловой нагрузки.
    ОтветитьНравится
  • >Значит слова кодируют образы,
    ---------------------------------------
    Не образы, а смыслы. Собственно именно ими мы в основном и оперируем. И проблема с декодированием заключается в том, что общим местом для всех людей является участок к которому у нас нет прямого доступа. Адекватная интерпретация слов или образов (не совсем уместное слово, но пока оставлю и так) в смысл сегодня без телепатии невозможна. Спасают косвенные методы а ля черного ящика, которые позволяют с достаточной степенью достоверности строить семантические структуры. Но... человеку на формирование связанной семантической структуры надо 15-25 лет и это при учете того, что она создается не на пустом месте, а есть еще и этнический банк, который мы осваиваем в раннем детстве. Автоматизировать это чрезвычайно сложно ... алгоритм-то неизвестен. Вот и придется делать эту работу в основном в ручном режиме — минимум 30 человеко*лет. Одно радует. Работа разовая.

    >образ это и есть отражение реальности
    ----------------------------------------------
    на рецепторах получить образ действительности не получится. Если остаться на уровне образности, то это скорее слепок от соприкосновения с действительностью. Примерно как в притче о 3-х слепых мудрецах и слоне. Имея коллекцию таких слепков можно попробовать построить модель действительности, достоверность которой будет определяться разнообразием и полнотой коллекции. Ведь образ — это описание самой действительности, пусть и в рамках нашего формализма, но полное, включая то, до чего не дотягиваются наши рецепторы. И по этой причине образ нам и не доступен.

    ОтветитьНравится
  • Сергей Шляхтов  14 мая, 18:15
    Сначала идут у Вас что слова кодируют образы, теперь смыслы какие-то. Вы уж определитесь, что там у Вас есть, а потом пишите. И что такое смысл в данном случае?
    Ну если на бытовом, то тогда понятно: смысл это есть определенная последовательность образов. Например как в басне, сначала рисуются образы, а потом раскрывается их смысл (для тупых).

    Для того и пишут, что отражение реальности, а не реальность, поскольку отражение не может быть идеальным. Т.е. наш мозг имеет некую копию реальности, но не идентичную самой реальности. Вот и все, что подразумевают под термином отражение реальности. А каким образом это отражение получено, это уже детали.

    ОтветитьНравится
  • Сергей, не обижайтесь, но вы через чур фривольно жонглируете словами. Поэтому у вас и непонятность образуется. Я ни разу, нигде не говорил, что слова кодируют образы. Это уже ваша интерпретация моих слов, попытка понять меня с помощью своего устава (системы знаний). Увы, это неэффективно.
    Образ и смысл существенно различаются. Примерно как 2 яблока на столе и цифра 2 в тетради.
    ОтветитьНравится
  • Сергей Шляхтов  15 мая, 02:02
    «Сергей, не обижайтесь, но вы через чур фривольно жонглируете словами.» — Я польщен! Ведь оно действительно, слова же это лишь способ кодирования смысла, и поэтому важен сам смысл, а слова второстепенны, и гораздо важнее подбирать смысл, чем слова.
    «Поэтому у вас и непонятность образуется.» — У меня нет непонятностей, с чего Вы это взяли? Непонятности они сплошь и рядом у Вас, например, на мой вопрос, что же кодируют слова, Вы ответили: «Говоря технологическим сленгом, образы поступающие на вход анализатора.» — а после этого имеете наглость утверждать, что этого не писали.
    «Это уже ваша интерпретация моих слов, попытка понять меня с помощью своего устава (системы знаний).» — Т.е. попытка Вас понять не эффективна, поскольку смысла в вашей писанине нет? Это следует из того, что же Вы сами написали.
    «Образ и смысл существенно различаются. Примерно как 2 яблока на столе и цифра 2 в тетради.» — Ничего не понимаю, в примере сравниваются два образа и не более того.
    ОтветитьНравится
  • Сергей Шляхтов  15 мая, 02:30
    А вообще Вы типичный пример человека, который сам не понимает то, чему он пытается научить других (меня это ерунда, а вот бедных детишек жалко).
    Объясняю на примере с цифрой два и двумя яблоками. Цифра два это лишь символ, как и два яблока. Смысл символа в контексте, т.е. он приобретает смысл только благодаря другим образам. Как. например. всего два яблока на дереве или два яблока на столе у учителя. Так же и цифра два в математическом примере имеет один смысл, а при нумерации совершенно другой. У образов или слов кодирующих образы нет самостоятельного смысла, вот и все.
    ОтветитьНравится
  • Понятненько. Сори обознался. А выглядел как живой...
    ОтветитьНравится
  • Сергей Шляхтов  15 мая, 02:35
    Обосрались и в кусты? Как это типично для «учителей жизни»...
    Не Вы первый, не Вы последний, не переживайте. У меня таких целая коллекция. И главное, все так искусно делали вид, что понимают о чем пишут, что я даже верил местами.
    ОтветитьНравится
  • Сергей осторожно, впустую натрете руки ведь. Вилку же потом держать не сможете.
    ОтветитьНравится
  • Сергей, вы как дите малое на слабо ловите. lol
    Что бы язвительные комментарии задевали человека, нужно быть или близким человеку, или иметь высокий авторитет в его глазах. Вы же со своим задиристым гребешком забавны. :)
    ОтветитьНравится
  • Сергей Шляхтов  15 мая, 02:57
    Дмитрий, Вы мне совершенно не интересны. Все, о чем Вы тут пытаетесь рассказать, я уже давно знаю. При том у меня есть целостная картина, а у Вас нет, и составлять ее Вы упорно не желаете. Так что помочь я Вам не могу, поскольку Вы сами этого не желаете, а толку читать Ваши цитаты из учебников, которые уже давно прочел и осмыслил, я не вижу. Для других читателей наш диалог тоже перестал быть интересным, поскольку ничего нового в нем уже не появится, кроме завуалированной ругани. Но если есть такой зуд, чтоб последнее слово было обязательно за Вами, то дерзайте.
    ОтветитьНравится
  • LOL
    ОтветитьНравится
  • После пары стаканов спорить лучше всего в родной компании — чай обознаешься, никто корить не будет. Свои же, все понимают. :)

    «С кем не бывает, — сказал ежик слезая с кактуса»:D

    ОтветитьНравится
  • Сергей Шляхтов  15 мая, 03:31
    Ну два последних слова это уже хамство. Впрочем, оно конечно интересно, почему люди дают себе советы, которым сами же не следуют?
    ОтветитьНравится
  • Естественно себе же советами и пенял, Сергей. Не вам же (Вторая бутылка пива явно была лишняя). Вам единственное что можно посоветовать — почаще бриться.;)
    ОтветитьНравится
  • Сергей Шляхтов  15 мая, 04:01
    Хороший совет, спасибо. Наверное я им воспользуюсь.
    ОтветитьНравится
  • Любопытно. Очень. В свое время, как раз лет пятнадцать назад, знал фамилию (армянскую) руководителя группы бывших МГУшников, работавших над созданием таких семантических «словарей», пригодных для применения в машинном переводе. Сейчас фамилию уже не помню. Интересно, имеют ли они отношение к этой разработке, или был ли их задел использован.
    ОтветитьНравится
  • Врэж Багратуни  12 мая, 17:12
    Так насколько я знаю, эту группу ABBY как раз возглавляет какая-то армянка. Может это одно и то же лицо.
    ОтветитьНравится
  • Нет, тот был мужчина.
    ОтветитьНравится
  • Врэж Багратуни  12 мая, 19:28
    В своё время много писали про некоего компьютерного гения Борис.... Фамилие запамятовал, это было армянское фамилие. Он со своей группой в начале 2000 подписал контракт с какой-то крупной американской компанией. Куда этот гений делся, почему о нём больше ничего не пишут. Может он просто уже умер?
    ОтветитьНравится
  • Врэж Багратуни  12 мая, 19:34
    Эврика, вспомнил, звали его Борис Бабаян. Проект был Эльбрус IV кажется.
    ОтветитьНравится
  • Спросил у структурного лингвиста, который мне это давным-давно рассказывал. Юрий Апресян зовут того специалиста по семантике.
    ОтветитьНравится
  • Врэж Багратуни  12 мая, 23:46
    Я лично знал такого известного философа. Имя его уже не помню. За 12 лет жизни в Брюсселе я очень многое к сожалению забыл.
    ОтветитьНравится
  • Вот он:

    ru.wikipedia.org/wiki/Апресян,_Юрий_Дереникович

    ОтветитьНравится
  • Кстати да, похоже его вклад, пусть и косвенный, в разработку ABBYY есть. Если я правильно понял вот это « Одной из наиболее интересных недавних его идей стала идея существования элементов семантического метаязыка, которые Апресян предложил называть «кварками» (использовав термин современной физики)» в сочетании со статьей про разработку нового продукта, это именно то, что положено в основу этого продукта.
    ОтветитьНравится
  • Искусственный интеллект получается не за горами? Осталось доработать мышцы на нановолокнах, аккумуляторы серно-магниевые, скелет карбоновый — и можно клепать армию андроидов — рабов.))
    ОтветитьНравится
  • Врэж Багратуни  12 мая, 17:14
    В книге «Цивилизации Богов», где всё сбылось до сих пор, прописано, что уже в этом десятилетие будут роботы-секретари. Это же класс.
    ОтветитьНравится
  • К сожалению, истинный ИИ дальше, чем может показаться :-(
    ОтветитьНравится
  • Врэж Багратуни  12 мая, 19:06
    Кстати, как только робот начнёт разными способами эгоистически защищать самого себя, вплоть до угрозы нам, то мы, люди тогда сразу же признаем в нём личность. Тест Тюринга тогда станет документом прошлого.
    ОтветитьНравится
  • Вреж, при функционале современного секретаря, его кибераналог можно было начать продавать еще лет 7 назад. Другой вопрос, что рынок еще не готов — в высоких креслах как правило сидят или обыватели или ретрограды.
    ОтветитьНравится
  • Врэж Багратуни  12 мая, 20:13
    Они могут сравторами стать? Я так в этом нуждаюсь. Ненавижу сам писать. Не овладел слепым письмом до сих пор. Лентяй я, могу только хорошо фаетазировать.
    ОтветитьНравится
  • Так ведь и эпл и гугол реализовали голосовое распознание. Собственно говоря в условиях кабинета оно весьма неплохо работало и раньше. Или речь о написании содержательной части? Так это уже не секретарская работа, а помошника-референта.. Да только судя по ряду признаков, вас удовлетворит только ментальный секретарь, программа реализующая текст минуя вербальную стадию.;)
    ОтветитьНравится
  • Профессиональные секретари с Вами не согласятся :-)
    Я работал в крупной организации с руководителями высокого уровня, и могу Вам с уверенностью сказать, что действительно ХОРОШИЙ секретарь — это большая редкость и ценность. Тут и коммуникации с клиентами, и «чувство момента», и многое другое :-)
    ОтветитьНравится
  • >Тут и коммуникации с клиентами, и «чувство момента»,
    >и многое другое
    ---------------------------------------------------
    Навешав на спеца кучу задач, его можно сделать не просто редким, а уникальным. Что бы не быть голословным:
    работник ЖЭК, обычный мужчина с прямыми руками и сообразительный, легко выполнит обязанности электрика, сантехника, столяра, плотника, сварщика. Добавим сюда непьющий, не раскручивает клиентов на допработы, не подворовывает. Думаете не возможно? Можно, но попробуй найти такого да еще на 30 т.р.:D
    Должностные обязанности базового секретаря вполне реализуемы на современном программно-аппаратном уровне. Уровень референта, на который часто загоняют хороших секретарей, правда пока не тянем.
    ОтветитьНравится
  • Врэж Багратуни  12 мая, 23:32
    :) Боюсь, все эти программ распознования до сих пор плохо работают, тем более на русском языке. Я в середине 90-ых испытывал программу Драгон или как то иначе назывался. Годился только для хохм. Вы сами уже пользовались такими прогамми? И как?
    Был у меня хороший соавтор Сарлык, он окончил ВГИК киносценарный, но его в Москве на м. Кузьминки местный молодняк убил в 2002 году, когда он встрял в их местные разборки. Он лучше меня мог писать. Идеи и все эпизоды были мои, а он очень грамотно прописывал всё. Царство ему небесное.
    ОтветитьНравится
  • Врэж Багратуни  12 мая, 23:42
    Дмитрий, соавторвсё ж лучше секретаря тем, что он может заводить. Одному совсем не интересно писать большие вещи. Тем более, что гонорары пока не светят. С одним приятелем буквально за месяц смеясь до упаду написали (общаясь только по телефону) фееричную комедию киносценарий. В Голивуде после перевода этот сценарий получил «скромные» 9 балов по 10 бальной шкале. Там вместо привычных голивуду трёх или четырёх находок, я напридумал почти сорок классных находок. Мне это очень легко даётся.
    А чичас я сирота казанская, без сколько либо грамотного соавтора.
    ОтветитьНравится
  • >Одному совсем не интересно писать большие вещи.
    ----------------------------------------
    :) И сказал дон Кихот дон Кихоту, ты поймешь меня с полуслову...
    Вреж, дальше можете не продолжать. С вами, мне по крайней мере, все ясно. :D
    ОтветитьНравится
  • Врэж Багратуни  13 мая, 02:09
    Легче походящего соавтора найти себе среди девушек, чем среди мужчин. Им гонор мешает признаться, что с идеями они не ахти, все сами с усами. Хотя, при ближайшем расмотрении их заветных идей, диву даёшся из неприхотливости. Я всего лишь пару раз встречал людей, которые говорили, что они могут хорошо писать, но вот с идеями туговато. Выстраивать сюжет мало кто сможет. Здесь я встретил Коганицкого. Дьявольски умный, талантливый и похоже очень работоспособный человек. Таких мне в жизни только пару раз довелось встретить. Жаль, он здесь очень редко появляется уже. Видимо сильно разочаровался местной публикой.
    ОтветитьНравится
  • А зачем тебе соавтор?
    ОтветитьНравится
  • А с идеями у всех туговато. И не потому что импотентны, а потому что зашорены на абсолютную уникальность. А на самом деле если в идеи есть 5% новизны — это суперкруто. Но это ведь так... недопустимо, признать для творящего, что его идеи на 90% копируют чье-то.
    Мужчина или женщина — не имеет значения. Главное что б был комплементарен. Вот тогда идет не хилый резонанс. А игра в одни ворота меня лично не восторгает.
    ОтветитьНравится
  • Врэж Багратуни  13 мая, 02:45
    Может есть сайт, где можно встретить ищущих соавторства. Видел два таких сайтп годика три назад. Но сайт был очень вяленький и авторы были почти подростками. У них в головах была только простенькая фантастика. Но может есть посолиднее. В конце концов идей стоящих остро не хватает даже Голливуду. А телеканалы с их сериалами вообще мертвы, так как у них совсем нет идей. А у меня их богатая россып по всем направления. Сериалы, аниме, сюрр, эпика, комедия, трагедия. Трагикомедия с элементами сюрра самые сложные и интересные. Кстати, в России они в самый раз были бы.
    В каком-то смысле все мои серафимчики могут стать ядром полноценных фильмов.
    ОтветитьНравится
  • Врэж Багратуни  13 мая, 07:07
    Александр Иерархов. Есть много киносценарных идей. Хотелось бы их увидеть на бумаге набраным красивым шрифтом. .
    ОтветитьНравится
  • >Но сайт был очень вяленький и авторы были
    >почти подростками.
    ------------------------------------
    Это вы не про Мошковский самиздат часом? ;)
    ОтветитьНравится
  • Врэж Багратуни  13 мая, 08:01
    Нет. Это был как бы специализированый сайт. Но он был почти безлюдным.
    ОтветитьНравится
  • Ну тогда попробуйте самиздат Мошковского/Там народ часто в соавторстве пишет. Вдобавок там и издатели с прочими пасутся.:)
    ОтветитьНравится
  • Врэж Багратуни  15 мая, 02:59
    ....признаем в нём личность.... Даже если он будет туп как валенок.
    ОтветитьНравится
  • Врэж Багратуни  15 мая, 03:12
    Дмитрий Михайлов 13 мая, 13:25

    Ну тогда попробуйте самиздат Мошковского/Там народ часто в соавторстве пишет. Вдобавок там и издатели с прочими пасутся.:)
    -------------------------------------------
    Серьёзно? Ой, а ссылку эту не кинете мне, Дмитрий? Мне заниматся этим в тыщу раз интереснее, чем заниматься реформой всей этой погрязшей в нравственном компосте цивилизации. Мавр сделал своё дело, написал им теорию. Теперь Мавр хочет расслабиться. Хотите берите, хотите нет, вашим же детям будет только хуже, у меня их всё равно нет. А вот фантазировать, придумывать такие сногшибательные эффектные идеи, которые больше никто никогда не сможет придумать, это моя страсть. Тут хочется по Пушкински сказать, а я да я, ай да ....! :)

    ОтветитьНравится
  • Да не вопрос, держите samlib.ru/
    ОтветитьНравится
  • Врэж Багратуни  15 мая, 04:27
    Да нет, ни на какую они особенно и не смеют претендовать. Уникальности они не взыскуют. Просто нет уровня, нет настоящей начитанности и поэтому их планка (которую они естественно же, считают высшей), очень низко расположена. Сколько раз, когда мне рассказывали люди свои киноидеи я удивлялся их бездарной механичности. У них нет некоего объёмного видения того о чём говорят. Они в силу своей неразвитости не чувствуют главное, контекстных матрёшкинских вложенностей смыслов друг в друга. Это так же, что мысль ихняя по всей видимости очень очень медленная. Им не по силам быстрое паралельное исчисление смыслов. Природой не дано. Ощущение, что какие-то медиаторы в мозгах присутствуют в мизерных количествах. Таким я чурбаном чувствую себя только с похмеля. Думаю, многие так, как с похмелюги чувствуют себя всю их постылую жизнь. :)
    ОтветитьНравится
  • Врэж Багратуни  15 мая, 04:30
    Слушаю клип Маши Распутиной «Ты меня не буди!» Шикарная вещь.
    ОтветитьНравится
  • Врэж Багратуни  15 мая, 04:40
    Попытаюсь, Дмитрий, описать, как это почти тактильно я чувствую.
    Там внутри них, как будто совсем нет воздуха, нет пространства, нет лёгкости. Как будто там у них спёртый чулан внутри которого тяжёлый тупой свинец или сырой кусок мяса из которог идёт тяжёлый пар. Да, именно так это ошущаеться. С такими тяжело общатся. У творческих людей нутро ошущается иначе. Поэтому я всегда инстинктивно окружал себя творческими молодыми полными энергии людьми, летунами. Видимо, чтобы не задохнутся от людей.
    Это я пишу вам, чтобы узнать ваши подобные ощущения. Ведь вы много раз писали, что почти идентично чувствуете многое.
    ОтветитьНравится
  • Кстати, самый дерьмовый переводчик с английского на русский — у корпорации Microsoft. Их онлайн-статьи переводит автоматически так безбожно, что хочется матом покрыть этих халтурщиков — читать вообюще невозможно, 75%смысла искажается.
    Наймите редакторов, что ли, миллиардеры, мля... :-)
    ОтветитьНравится
  • И скажу а вам дерьмовый у них не только переводчик))
    ОтветитьНравится
  • Ха-ха, точно!
    ОтветитьНравится
  • А можно таки спросить что у них дерьмовое? И так же можно поинтересоваться с какой вы сейчас операционки на форуме?
    ОтветитьНравится
  • Ну может правда с андроида... :)
    ОтветитьНравится
  • Не знаю кто как, а я на 90% из-под линя, на 9% из-под андроида и по великим праздникам, когда настроение очень хорошее, из-под винды.:)
    ОтветитьНравится
  • На этом компе семёрка два года и не одного сбоя. Чего я делаю не так??? Обьясни почему она плохая??? Хочется знать... :) Ну кроме винды тут правда линуха и мак есть... Но беда, они не дотягивают...
    ОтветитьНравится
  • Легко — дерьмовые у них средства разработки (Visual Studio), некоторые компиляторы, недобитые компоненты Офиса типа Outlook (кто работал с TheBat — поймёт меня) и Access, интерфейсы ОС Vista/7, риббоны, компоненты операционок типа браузера (вы на IE сидите, да? или всё же на опере или файерфоксе?), файлового менеджера (кто сидит на Эксплорере -ау? нормальные давно уже на Total commandere или Servant Salamandere, ну в кр. случае FAR-е)поиска, и многое другое.
    Есть и хорошие вещи, конечно. Про MS можно почитать тут:
    www.vb-net.ru/AbsoluteEvil/index.htm
    ОтветитьНравится
  • Я с Винды 2003
    ОтветитьНравится
  • Отладкой драйверов на досуге можно попробовать заняться :-)
    Падения гарантированы!
    ОтветитьНравится
  • У семёрки дрова вынесены из ядра если можно так сказать. Так что они не приводят к падениям системы...
    ОтветитьНравится
  • Анатолий Алексеев 12 мая, 23:36
    Легко — дерьмовые у них средства разработки (Visual Studio),
    --------------------------------------------
    Но вота беда... Пользуются этим дерьмом. А почему?
    ОтветитьНравится
  • Грамотный маркетинг. Эффект масштаба.
    ТО же самое — спрашивать, почему пользуются антивирусом Касперского. Продукт -конченное г..но (и всегда им было), однако же выставили ценник выше среднего (и даже выше гораздо более качественных аналогов типа Nod,Symantec и Avast), каждый день клепают какие-то обновления базы, и новые юзеры ведутся!
    Студией я и сам пользуюсь, как и виндой, и не перестаю удивляться халатности разработчиков и порой откровенной враждебности к пользователю. Вы не считаете, что софт должен помогать пользователю, предугадывая его желания? А теперь попробуйте настроить стандартный сервис Routing and Remote Access на машине с двумя сетевыми картами и внешним интернетом для раздачи трафика и роутинга пакетов. Или, допустим, вы — разрабочик, пялитесь в монитор весь рабочий день. В старой студии попытайтесь увеличить шрифт скроллом. Получилось? Не выбешивает?
    ОтветитьНравится
  • Трудно профи заставить пользоваться говном если есть хорошее... А шрифт не вышибет вроде... Хотя мне нет надобности увеличивать. Монитор за 30 дюймов... :))
    ОтветитьНравится
  • Кстать я б наверно затруднился сказать в чём халатность разработчиков в семёрке и 2008 R2...
    ОтветитьНравится
  • Анатолий Алексеев 12 мая, 23:58
    почему пользуются антивирусом Касперского. Продукт -конченное г..но (и всегда им было), однако же выставили ценник выше среднего (и даже выше гораздо более качественных аналогов типа Nod,Symantec и Avast)
    ------------------------------------------------------

    Да, тут согласен, продукт отстой выше всякого возможного. Я б из всего предпочёл авиру. Даж фри вариант может дать фору всему. Ну или нортон, то который «360» Для дома я имею в виду...

    ОтветитьНравится
  • Да, Авира — отличный.
    ОтветитьНравится
  • Врэж Багратуни  13 мая, 00:30
    Я любил шуструю Оперу, но видимо винд специально нацелен на то, чтобы устроить мне пакости если я воспользуюсь не его браузером. Как в плену. Вынужден его дерьмовым браузером пользоватся.
    ОтветитьНравится
  • Так поэтому все и переходят на альтернативные разработки.
    Ну вот у меня монитор 30’’ от Эппл, разрешение native 2560x1600.
    Шрифт в 6-й студии во весь экран выглядит достаточно мелким.
    ОтветитьНравится
  • работать крайне неудобно после NT/XP/2003.
    чисто с точки зрения нового пользовательского интерфейса.
    с 2008 стараюсь работать по минимуму, потому как мне он неудобен.
    + там функциональность большинства старых программ/компонент особо никто не улучшал
    ОтветитьНравится
  • Нет, так нельзя сказать. Вы ещё скажите, что в 7-ке драйвера режима ядра вынесены из нулевого кольца в user mode :-)
    ОтветитьНравится
  • Ms начиная с Висты как раз и требует обязательной цифровой подписи дров, чтобы в режиме ядра непонятные поделки не крутились...
    ОтветитьНравится
  • Господи сусе... Да там изменения то чиста косметический в том интерфейсе...
    ОтветитьНравится
  • Вреж Багратуни 13 мая, 00:30
    Я любил шуструю Оперу, но видимо винд специально нацелен на то, чтобы устроить мне пакости если я воспользуюсь не его браузером. Как в плену. Вынужден его дерьмовым браузером пользоватся.
    --------------------------------------------------

    От ничё не понимаю... Вроде опрера работает как родная... Щас правда с хромиума пишу....

    ОтветитьНравится
  • Анатолий Алексеев 13 мая, 00:37
    Ms начиная с Висты как раз и требует обязательной цифровой подписи дров, чтобы в режиме ядра непонятные поделки не крутились...
    ---------------------------------------------

    Само по себе прально это. Потому как поделка в режиме ядра верный бсод вооще то...

    ОтветитьНравится
  • В монолитном линушном ядре думаете крутятся поделки? Попробуйте досыпать если блажь есть и увидите что будет...
    ОтветитьНравится
  • А потом пеняем на Билла...
    ОтветитьНравится
  • Я к тому, что нестабильность осталсь. Пример — товарищ писАл софтину, отлаживал её по сети с зарубежным партнёром, у товарища стояла вынь, у его партнёра — макось. И вот в процессе отладки ему друг заграничный звонит — абонент завис,ты куда, мол, пропал? А товарищ ржёт, у меня, говорит, BSOD :-)
    ОтветитьНравится
  • У меня сервер 2008 r2 со всеми заплатками тоже иногда падает.
    Без объяснения причин. Так что кластерные технологии нам помогут, и виртуализация.
    ОтветитьНравится
  • Какая вынь и какая софтина? Стабильность макоси сильно преувеличенна маркетингом и обеспечивается как то только Царёвым Выбором железа и тем Царёвым Диктатом в софте....
    ОтветитьНравится
  • А чё, не пишет какая дрова вызвала в дампе? Тогда это железяка виновата. Падает и будет падать...
    ОтветитьНравится
  • IRQ_LESS_OR_NOT_EQUAL, и поди его разбери.
    Да, какой-то конфликт по железу. у нас не брэндовое пока :-(
    ОтветитьНравится
  • серверная, кажется 2003, софт по каким-то удалённым коммуникациям через сокеты для административных целей.
    Это не реклама Мака, это пример из практики... И он не единичный.
    Недаром же MS не гарантирует работу Win в mission-critical и life-crilical приложениях, это не операционная система реального времени...
    ОтветитьНравится
  • А что пишет анализатор дампа созданного при бсоде? Всегда разные причины?
    ОтветитьНравится
  • А зачем вам риалтайм? МАК тоже не риалтайм...
    ОтветитьНравится
  • да я особо не разбирался, машинка тестовая
    ОтветитьНравится
  • Вот щас моими стараниями был сбой видеодрайвера. Винда спокойно его перезапустила...
    ОтветитьНравится
  • круто :-)
    ОтветитьНравится
  • Хотите риалтайм прошу к юниксоидам. Можно поставить риалтаймовское ядро. В бунтах и сусях есть готовые точно. Собирать даж не надо...
    ОтветитьНравится
  • Так точно, я в курсе.. мне RTOS пока не нужны, эт я для общей картины упомянул, не все же знают...
    ОтветитьНравится
  • А всё таки, зачем может понадобится риалтайм?
    ОтветитьНравится
  • Управлять медицинским оборудованием (например, искусственным сердцем, аппаратом гемодиализа), или аппаратурой самолёта...
    Там, где нужен гарантированный отклик ОС за оговоренный квант времени...
    Если ко мне вдруг обратится такой клиент, будут кодить для RTOS на сях или асме...
    ОтветитьНравится
  • Вообще то нужно уложится только в допустимый тайм для данной системы. Они разные для разных систем. И всё. Реалтайм тут не очень нужен...
    ОтветитьНравится
  • Добавлю про самолёт. Если им может управлять человек то допуски по времени весьма приличные... :)
    ОтветитьНравится
  • Ну разве что гашение резонансов, колебаний... Гдето на гиперзвуке и около... То может...
    ОтветитьНравится
  • Дело в том, что все боятся брать на себя риск. Засудят ведь потом, если случись что...
    ОтветитьНравится
  • Может, и так, однако такое редко практикуют...
    ОтветитьНравится
  • Анатолий Алексеев 13 мая, 01:38
    Дело в том, что все боятся брать на себя риск. Засудят ведь потом, если случись что...
    -------------------------------------------------

    О! Всегда находят козла отпущения. И никогда того кого следовало бы... Кстать так ничего нового не взлетит... И не случится ИИ... Если не рисковать...
    ===========================================

    Анатолий Алексеев 13 мая, 01:39
    Может, и так, однако такое редко практикуют...
    ------------------------------------------------------------

    Какое? Гашение резонансов на гиперзвуках? Без этого эти вещи не летают...

    ОтветитьНравится
  • Анатолий Алексеев 13 мая, 00:36
    Нет, так нельзя сказать.ядра вынесены из нулевого кольца в user mode :-)
    -----------------------------------------------------------

    Нэт... Но идеология по выносу в user mode всего «неблагонадёжного» кода получила развитие. И кажется стабильность налицо... Вы говорили что там у вас падает винда? Так хоть память бы ночку протестировали. Как правило изза неё падения...

    ОтветитьНравится
  •  — Пра Виндус уж только ленивый не говорит.. С вложенными шпионами и возможностями для внешнего контроля.. И это политика.. сзади стоят спецслужбы США..
    ОтветитьНравится
  • Так тестировал memcheck-ом, всё хорошо. А по факту — есть падения. Какое-то железо между собой не всегда дружит, видимо.
    ОтветитьНравится
  • memcheck нафиг. memtest. Есть на всех Hiren’s Boot-ах скажем...
    ОтветитьНравится
  • Память редко когда BSOD вызывает, чаще просто подвешивает процесс. А вот кривые руки кодеров драйверов или биоса, если не считать аппаратный брак, почти всегда
    ОтветитьНравится
  • Она ВСЕГДА вызывает бсод...
    ОтветитьНравится
  • Ессно если в ней сбой...
    ОтветитьНравится
  • Какая вероятность попадания сбойной ячейки в адресное пространство? На десктопах ЕСС не ставят и там процент естественных ошибок достаточно велик. Но благодаря тому что только очень маленький процент их может критически повлиять на работу системы, да и то не фатально, ЕСС-овая память стоит преимущественно на серверах.
    ОтветитьНравится
  • Винда использует всю память только не говорит об этом. Для дискового кэша... Как и юниксоиды...
    ОтветитьНравится
  • ЕСС-овая не нужна. В случае исправной памяти вероятность сбоя от нуля неотличима. Неисправная может сбоить эпизодически....
    ОтветитьНравится
  • Но неисправная память вызывает бсод как правило при повышении нагрузки на неё, то есть занятости её. Но не всегда....
    ОтветитьНравится
  • Это здесь не причем. Оперативка не однородна и имеет сегментную структуру. Область данных невоспримчива к сбоям, программная имеет встроенные алгоритмы проверки, а вот адресная... Но и тут это приводит к вылету за пределы сегмента (достаточно частая ошибка неправильной адресации) и перезапуску алгоритма, если программа поддерживает переинициализацию. Намного страшнее неверный возврат в драйвере.
    ОтветитьНравится
  • Всё просто. Найди сбойную планку и поставь эксперимент. Юниксы будут виснуть винда бсодить...
    ОтветитьНравится
  • Даже на домашнем компе такая фигень была из-за планки... Могла работать час два три нормально а могло бсодить непрерывно....
    ОтветитьНравится
  • Но всё другое тож не исключается ессно...
    ОтветитьНравится
  • Вот-вот, наверное это оно. С такого вот boot-cd.
    ОтветитьНравится
  • Так не трогайте таких бут-сд. Они не для вас. Каспер рулёз... :)
    ОтветитьНравится
  • Вернее не «Так...» а «Тогда...»
    ОтветитьНравится
  • Файнридер собственно ничего не распознаёт. Если грубо говорить то каждый знак там прописан вручную. Видимо этот принцип решили применить и здесь. Но я думаю недооценили несопоставимость задач. Буков русских всего то 33, английских поменьше... А тут ой... И не буквы...
    ОтветитьНравится
  • Врэж Багратуни  12 мая, 19:07
    Уже в середине 90-ых Файн ридер вполне прилично у меня распознавал тексты.
    ОтветитьНравится
  • Врэж, прочитай ещё раз о чём я...
    ОтветитьНравится
  • Врэж Багратуни  12 мая, 23:49
    Пусть и ручным образом прописывают. Лишь бы работало. А вы подобные современные программы пробовали?
    ОтветитьНравится
  • Дело в малом. Я думаю что ручным методом это попросту нельзя прописать... Обьём взаимосвязей слишком велик. Не возможный символы 33 букв...
    ОтветитьНравится
  • Врэж Багратуни  13 мая, 00:37
    Вижу вы спец в этом, в отличии от меня старого любителя. Интересно создан ли распознаватель рукописных текстов? Я бы хотел 10 моих записных книг с записаными там моей рукой массой идей? Переписать бы их в комп, архивировать и на разных своих мейлах схоронить их.
    ОтветитьНравится
  • Нет. Каракули ничего распознать не может... Или мне не известно...
    ОтветитьНравится
  • ABBYY FormReader – система ввода форм, заполненных от руки или на принтере, с применением технологии интеллектуального распознавания символов — ICR (Intelligent Character Recognition).
    ОтветитьНравится
  • Раз «от руки» то можно и попробовать. Сам «это» не пробовал, не знаю...
    ОтветитьНравится
  • Врэж Багратуни  13 мая, 18:38
    ...заполненных от руки ....
    -----------------------------------
    Всё же от руки можно?
    ОтветитьНравится
  • Пробовать надо... ;)
    ОтветитьНравится
  • -- Браво ! Чудненько ! Молодцы ! Это, вообще говоря, кусочек из области ИИ.. НО ! Отличие ИИ в том что оно само МОЖЕТ произвольно менять структуры правил .. И тут не видно входа туда.. Да это и естественно..,вход должен быть из ИИ. Жалко ,что ребята пока не дотянулись до идеологии ИИ. Но сам подход впечатляет. Я в старой Мембране писал. что меня заинтересовал один аспект восприятия Человека. Дело в том ,что комп постепенно вытесняет наш Разум даже из типично человеческой деятельности (скажем: как качественный перевод, решения сложных мат.задач и т.п...). Но у мозга есть огромный запас.. я тогда давал оценки возможностям нашего мозга. Реально повысить производительность в решении научных сложных задач в сотни и тысячи раз. И тогда уже скорость — не самое существенное качество, там уже важнее само качество мышления и взаимодействие машины и человека..
    ОтветитьНравится
  • Сергей Асташкин 13 мая, 09:23
    Это, вообще говоря, кусочек из области ИИ..
    -----------------------------------------------------

    Скорее из области жёстких алгоритмов....

    ОтветитьНравится
  • -- а это как: «— автоматизированное корпусное дообучение — лингвистические описания верифицируются и дополняются на основании статистической обработки корпусных данных.»
    ОтветитьНравится
  • Я думаю это слова в «заявлении о намерениях». Может ошибаюсь, но все продукты этой фирмы жёсткие с вручную прописанными признаками. Знаков там... Не думаю что б отступили... И отступать некуда. ИИ так же далёк как в 50-е годы...
    ОтветитьНравится
  • -- Не, ну что ИИ не так работает это да , но есть основная идея ,которая рулит и в ИИ — плавающая верификация... ИИ имеет те же проблемы что и скажем слабообразованный инженер -понятия есть, ,знаний много, но полочки знаний ,на самом деле — виртуальные и он только опытом расставляет одни и теже сущности целиком на разных полочках ..
    ОтветитьНравится
  • Нет. Интеллект это никак не база данных...
    ОтветитьНравится
  • Это ваза банных...
    ОтветитьНравится
  • -- Я такое нигде и не говорил — но правила работы с информацией, где верификация — первична..
    ОтветитьНравится
  • Ладно... Верификация чего с чем в этой задаче?
    ОтветитьНравится
  • -- этот блок — это уже вход в него:

    «
    --— реферирование и аннотирование (написание краткого содержания длинных документов)...
    ---— автоматизированное корпусное дообучение — лингвистические описания верифицируются и дополняются на основании статистической обработки корпусных данных.
    ----------------

    — Семантический анализ (выявление выражаемого значения в системе языка);

    — Синтез из универсальной семантической структуры предложения на выходном языке»

    Александр, всё развивается, мне нравится что они делают.. Работа, конечно, огромная, она сродни обучению хорошего аспиранта ..

    ОтветитьНравится
  • Сергей Асташкин 14 мая, 21:10
    Работа, конечно, огромная, она сродни обучению хорошего аспиранта ..
    --------------------------------------------------------------------------------

    Уникально.... Из фольклору я полагаю? :)))

    То что они делают возможно и полезно, но не более чем файеридер... То есть «ничего нового»... Скорее всего, потому почему я сказал. Но может я ошибаюсь. Информации нет что б решить чем именно занимаются...

    ОтветитьНравится
  • впечатляет :-)
    ОтветитьНравится
  • Врэж Багратуни  18 мая, 02:52
    Вот что близко по теме я нарыл в компьюленте.

    Преодолим ли языковой барьер Википедии?

    17 мая 2012 года, 13:41 | Текст: Дмитрий Целиков | Послушать эту новость


    Вам когда-нибудь приходило в голову, что Википедия содержит огромное количество нужной информации на незнакомых вам языках, к тому же изложенной с позиций иной культуры?

    Дабы преодолеть языковой барьер, Брент Хехт из Северо-Западного университета (США) и его коллеги создали «Омнипедию» — ПО, позволяющее просматривать статьи на одну и ту же тему из 25 языковых разделов Википедии.

    Так носители дравидийского языка малаялам праздновали десятитысячную статью в своём разделе Википедии. (Фото Abhishek Jacob.)

    Это не просто ещё один автоматический переводчик. Программа анализирует ссылки на боковой панели, указывающие на иноязычные статьи той же тематики. Система проходит по этим ссылкам и пытается понять, какие темы универсальны в данной области, а какие — специфичны для каждого языка, после чего отображает их все.

    Этот метод анализа не назовёшь надёжным: например, на многих языках «Теория заговора» связана со статьёй об НЛО, а в испанском разделе такая ссылка отсутствует, хотя сама статья об НЛО есть. Поэтому приходится применять дополнительные алгоритмы, которые охотятся за такими недостающими звеньями.

    «Омнипедия» отображает каждую тему, найденную в конкретной статье, в виде круговой диаграммы, разделённой на цветные сегменты: каждый из них представляет язык, на котором обсуждается тема. Щелчок по кругу открывает соответствующий фрагмент из статьи, и он автоматически переводится с помощью Bing Translator.

    Разработчики попросили 27 добровольцев с различным знанием языков протестировать программу. Говорят, многие были поражены тем, какого количества информации лишена английская Википедия и насколько полны другие языковые разделы — например, японская статья о регги.

    «Омнипедия» была представлена в Остине (штат Техас, США) на Конференции по вопросам человеческого фактора в компьютерных системах.

    ОтветитьНравится
  • Врэж Багратуни  25 февраля, 02:53
    Обещали, что к концу 2012 года выйдет Compreno, компании ABBYY революционно эфективный переводчик. А где он, где положеная для такого продукта бешеная реклама? Опять надули?
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 03:02
    Они тогда решили что смогут сделать его свооим фирменным методом, как в своих остальных продуктах. То есть «прописыванием всего вручную». Это было весьма самонадеяно. Видимо облом был эпичным...
    ОтветитьНравится
  • Врэж Багратуни  25 февраля, 03:15
    А у тебя есть дополнительная информация?
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 03:37
    Не интересовался. Просто знаю как они хотели решить эту проблему. Такой перевод невозможен без ИИ. Не тех «элементов ИИ» что пестрят в рекламах а ИИ который Интеллект. Хотя и искусственный...
    ОтветитьНравится
  • Врэж Багратуни  25 февраля, 03:40
    Замкнутый круг получается. В каком то смысле Comprendro и является почти Искуственным Интеллектом.
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 03:45
    Заметь, качество перевода того же гугла, ну или бинга, удовлетвоорительно если переводится текст написанный литературно-правильным языком. То есть тогда когда возможно какое-то жёсткое соответствие. Которое и реализует программа перевода. Попробуй перевести гуглом форум. Сам поймёш разницу между сложной программой и ИИ....
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 03:50
    Врэж Багратуни  25 февраля, 03:40
    В каком то смысле Comprendro и является почти Искуственным Интеллектом.
    -----------------------------------------------------------------------------------------------

    Нет. Он мог являтся только слоржной программой. Представь некоторое так сказать «непрерывное поле соответствий», в данном случае языковые соответствия. Для алгоритма они все эти соответствия-состояния недостижимы. Достижима некоторая «сетка» в этом непрерывном поле. А то что ИИ может и должно покрывать все эти состояния... Ну не знаю понятино я или не очень... :)

    ОтветитьНравится
  • Александр Иерархов  25 февраля, 03:51
    Ещё проще — интеллект не есть сумма заученного... :))
    ОтветитьНравится
  • Врэж Багратуни  25 февраля, 03:54
    Так ведь некая размытость вообше свойственно любой информации. Подозреваю, что такой продукт как Виндовс не менее сложная программа. То есть продукт подобной сложности, как Компрендро в принципе достижим.
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 03:59
    Да программа. Но не интеллект. Она просто реализует заранее заданное. И только лишь... Сложность достижима любая. Только вся её работа заданна заранее.
    Помнишь ту гермионную сеть? Её формирование не заданно изначально (можно так сказать, так как «информион» таки существует). И поэтому не факт что результат можнет быфть описан конечным алгоритмом... А это признак ИИ...
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 04:01
    Кстати можно представить что этот самый информион будет выознакать сам, кагбэ случайно. Но результат... может и вовсе не напоминать ничего человеческого...
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 04:04
    Врэж Багратуни  25 февраля, 03:54
    Так ведь некая размытость вообше свойственно любой информации.
    ----------------------------------------------------------------------------------------------------

    «Размытость» свойственна не информации а комплексу информация-наблюдатель... :)

    ОтветитьНравится
  • Врэж Багратуни  25 февраля, 04:11
    Неточность вообше свойственна языку. Тому есть миллион причин. Например широкое и узкое толкование, или кантекст, который тоже в другом контексте. У разных наций свои культурные контексты...
    ОтветитьНравится
  • Врэж Багратуни  25 февраля, 04:14
    Опять же одно и тоже с какой интонацией будет сказано. С издёвкой, иронией или просто сухая информация.
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 04:14
    Этому есть только одна причина — то что естественный язык продукт интеллекта и обслуживает интеллект. Его коммуникацию....
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 04:16
    А сам интеллект не детерминирован. И его продукт отражает это.,. :))
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 04:21
    А где ж ГовноПроизводители а... Пусся, Боряша иижесними... :)))
    ОтветитьНравится
  • Врэж Багратуни  25 февраля, 04:35
    Думаю, неспециалистам в эти дебри лучше не стоит и соватся. Это одна из наисложнейших проблем вообше. Герменевтика. Не исключено, что человечество эту проблему на приемлемом уровне никогда не сможет разрешить.
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 04:37
    Ну почему ж не стоит? Специалистам нужны идеи вообщето...
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 04:40
    Рассею давно видел? maps.yandex.ru/?um=7dE-HbYtMlNfO5HPPv_D5gvrJ1O1lL50&l=map Ткни в «показать», выбери спутник, приблизь и ткни «панорама». Сможешь бродить по улицам, там стрелки на асфальте... :)
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 04:40
    Можешь перебраться в москву... :)))
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 04:44
    Как это управляется надеюсь разберёшься. Или специалиста надо? ;)
    ОтветитьНравится
  • Врэж Багратуни  25 февраля, 04:51
    По гуглеарз я иногда спускаюсь в Москву и брожу по тем местам где жил. Действительно много изменилось.
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 04:51
    Ну и Холодный Ядерный Синтез https://www.youtube.com/watch?v=E7uR74JYUlA
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 04:54
    Врэж Багратуни  25 февраля, 04:51
    По гуглеарз я иногда спускаюсь в Москву....
    ---------------------------------------------------------------------------------------

    Тут сделано получе....

    ОтветитьНравится
  • Александр Иерархов  25 февраля, 04:54
    Получше...
    ОтветитьНравится
  • Врэж Багратуни  25 февраля, 04:55
    Сколько людей мечтают жить там где я жил и живу. А я там живу вынуждено. Я рад был бы свое место уступить им и поселится в небогатом маленьком южном городе.
    ОтветитьНравится
  • Врэж Багратуни  25 февраля, 05:05
    Жаль у Тбилиси нет вюстрит. Пройтись по местам детства очень хотелось. Узнать как сейчас называется интернат в котором я учился 5 лет и попробовать кого нибудь найти через Одноклассник.
    ОтветитьНравится
  • Врэж Багратуни  25 февраля, 05:06
    А почему там Белгород?
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 05:09
    Потому что я там искал чего то....
    ОтветитьНравится
  • Врэж Багратуни  25 февраля, 05:11
    СЛЮШАЙ, это гораздо хуже гугловского. Здесь просто схема.
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 05:15
    Ну вот, специалиста не хватает... Не дошло включить спутниу или гибрид... А «панорама» так вааще скрыта.... :)))
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 05:15
    ...включить «спутник» или «гибрид»...
    ОтветитьНравится
  • Врэж Багратуни  25 февраля, 07:29
    Net, eto ne to.
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 13:20
    Значит ть интернету у тебя «не то»... :)))
    ОтветитьНравится
  • Александр Иерархов  25 февраля, 13:20
    ...скорость интернету...
    ОтветитьНравится
  • Врэж Багратуни  25 февраля, 20:00
    Minimum 20 Mb v sekundu. Razve etogo nedostatochno?
    ОтветитьНравится