PDA

View Full Version : AI/NLP/KE - Beсти: Язык-Мышление-ВиртРеальность..



AiBollid
03-03-2011, 11:59 AM
--------- subject: AI/NLP/KE - Beсти: Язык-Мышление-ВиртРеальность..
03-MAR-2011_01

Поскольку - телепатия
и обще-волновое общение людей/киборгов и ИИ задерживается..
то для слияния всех ЕИ+Ии мыслящих Планеты требуются более продвинутые средства чтения и понимания естественно-языковых документов, текстов, фонограм..

Даже интуитивно-простые читалки, распознающиие более дюжины различных шрифтов - выполняют достаточно интеллектуальые операции..
а уж чтение рукописей - вообще невозможно без Ии..

Далее,
понимание уже введенного текста
- уже примыкает к академической Проблеме "Текст-Смысл", базирующейся на гипотезе что Человеческий Язык развивался вместе с усложнением Мозга, и служил главнейшим стимулом этому мозгу..

Грубо-говоря считается
что Подконтрольная СОЗНАНИЮ область Мозга.. содержит этакие семантические наклейки на каком-то прото-человеческом языке СМЫСЛОВ..
и
Логическое мЫшление - идет в этом Языке..

Читая последующие посты-заметки - имейти ввиду
что пока доступно компьютерное понимание только весьма Ограниченного Естественного Языка (ОЕЯ), названного Ак Ершовым - "Деловой Прозой".

PS: Англоязычная литература слово "Ограниченный" - мудро опускает..

итак имеем: NLP (Natural Language Processing), NLU (NL Understanding), NL Web-Search Engine), TM (Text-Mining, Text-Resuming/Meaning Extraction), and NLSP (NL Speech Processing)

AiBollid
03-03-2011, 12:07 PM
03-MAR-2011_02... ( http://lenta.ru/news/2011/03/01/ocr/ )
03-MAR-2011_A: Google запустил "облачный FineReader" с поддержкой русского языка: Сервис Google Docs научился распознавать текст на PDF-документах и изображениях, написанный на 34 языках, в том числе на русском. Об этом сообщается в официальном блоге Google.

Документы, которые необходимо распознать, можно загрузить в облачный сервис Google так же, как и обычные файлы. При этом пользователи должны будут пометить в специальном поле, что они хотят перевести эти документы из их нынешнего формата в формат Google Docs, а также указать, на каком языке он написан.

После этого текст будет автоматически распознан, а пользователям будет предоставлена возможность его дальнейшего редактирования с помощью Google Docs. Подробнее ознакомиться с интерфейсом загрузки документов в Google Docs можно здесь (требуется учетная запись Google).

Сервис оптического распознавания текста (OCR) был внедрен в Google Docs в июне 2010 года. Первоначально с его помощью можно было автоматически распознавать информацию на пяти языках: английском, французском, немецком, итальянском и испанском. Сервис является бесплатным.

PS: В настоящее время на рынке представлено несколько программ, которые обеспечивают функции распознавания текста. Одним из наиболее популярных подобных решений является ABBYY FineReader (Russia).

AiBollid
03-03-2011, 09:14 PM
03-MAR-2011_26... ( http://lenta.ru/news/2009/05/29/bariton/ )
29.05.2009, Речевой ген человека научил мышей пищать баритоном: выявлeны ранее неизвестные функции так называемого речевого гена человека - Foxp2 . ==> В частности, ученые определили, что работа этого гена влияет на частоту издаваемых звуков и рисунок работы нейронов мозга.. ...

AiBollid
03-04-2011, 10:16 PM
04-MAR-2011_73... from AiBollid:
Проблема Речь <===> мЫшление - одна из центральных и в ИИ,
и в становлении Хомо-Сапства, и в понимании ЕИ,
и в новом бизнесе - Сем-Веб 3.0\4.о, вкл ОЕЯ вэб-сёpч..

Еще одним приложением является
голосовое общение с Интеллектуальными под-системами
- от батальенных роботов до банковских и др. вопрос-ответных (Q & A) систем общения
с Юзерами-пользователями-Кастомерами..

Тут мы слегка касаемся Конторского ИИ, Обработку сигналов, Математику Андрея Маркова, И! Представление-Моделирование Лингвитических знаний...

AiBollid
03-04-2011, 10:19 PM
04-MAR-2011_74... ... ( http://www.cybersecurity.ru/prognoz/76284.html )
15-Aug-2009_A... ...Компьютер и человеческий мозг становятся ближе друг к другу?! Ученые говорят, что человеческий мозг - это уникальный когнитивно-аналитический инструмент. Его возможности в познании, оценке и анализе окружающей информации еще очень долго не будут доступны для компьютеров в том же объеме и с тем же качеством. Больше других ученых интересую когнитивные возможности нашего мозга - исследователи хотят понять как наш мозг способен отличать речь от других звуков, классифицировать источник и направление звука.

Физики из Института им Макса Планка в немецком Лейпциге давно работают над системами, позволяющими компьютерам распознавать человеческую речь и транслировать ее в текст, однако успехи исследователей на этой почве были невелики.

Сейчас здесь разработана новая математическая модель (non-Markov HMM? Hidden Markov Model), способная улучшить автоматические процесс разпознавания и обработки человеческой речи.

Авторы методики говорят, что в недалеком будущем такие алгоритмы приблизят машины к человеческому мозгу...

AiBollid
03-04-2011, 10:23 PM
04-MAR-2011_74... ... ( http://www.cybersecurity.ru/prognoz/76284.html )
15-Aug-2009_B...Cont: Немецкие инженеры говорят, что многие люди знают, что сложно компьютерам иметь дело с человеческой речью. "Человек, которому приходится общаться с автоматической телефонной системой, должен запастись терпением.

Если вы говорите слишком быстро или слишком медленно, если ваше произношение не идеально четкое или если рядом с вами находится источник шума, то система вас не поймет", - говорит Стефан Кибель из Института Макса Планка.

Проблема современных систем распознавания голоса заключается в том, что они очень чувствительны к изменениям. Когда нынешние системы пытаются понять, что говорит человек, то они анализируют свою базу знаний, сравнивают частоты и звуковые комбинации, таким образом пытаясь найти совпадения.

"Очевидно, что наш мозг работает иначе.

Мы полагаем, что мозг опирается на временные последовательности.

Многие наши мозговые стимулы состоят из временных последовательностей.

Музыка и речь являются упорядоченными последовательностями с разной длиной, но иерархически упорядоченные. Полагаем, что наш мозг классифицирует разные сигналы от маленьких и быстро меняющихся компонентов (букв) до больших и медленно меняющихся (тем)", - говорит ученый... ...

AiBollid
03-04-2011, 10:26 PM
04-MAR-2011_74... ... ( http://www.cybersecurity.ru/prognoz/76284.html )
15-Aug-2009_C...Cont: Немецкие ученые говорят, что их исследования доказывают значение информации, разбитой на разные временные уровни восприятия.

"Мозг постоянно ищет временные структуры в окружающей среде,
чтобы можно было сделать логический вывод о том, что последует дальше.

Таким образом, мозг может часто предсказывать следующий звук
на основе медленно меняющейся информации", - говорит он.

Иными словами, наш мозг на подсознательном уровне способен
как-бы предугадывать слова в зависимости от контекста разговора.

Чтобы проверить эту гипотезу, исследователи
создали математическую модель, которая в упрощенном виде имитирует нервные процессы, происходящие для осмысления речи. Нервные процессы были описаны алгоритмами, которые обрабатываются на различных временных уровнях.

Модель могла обрабатывать как отдельные звуки речи, так и слоги или слова. Если система делала неверный прогноз о слове или контексте, то модель обнаруживала ошибку.

В качестве языка ученые использовали упрощенную модель из четырех гласных букв а, е, я, о, которые объединялись в слоги. "В первую очередь мы хотели проверить верность самой концепции, в дальнейшем на этой базе можно строить более сложные системы, приближенные к естественному языку", - говорит Кибель.

"С неврологической точки зрения самым важным для нас были реакции, похожие на те, что происходят в головном мозге", - рассказывает ученый.

AiBollid
03-04-2011, 10:28 PM
04-MAR-2011_75... ( http://science.compulenta.ru/443204/ )
21-07-2009.. ученые выяснили, почему лучший возраст для изучения иностранного языка — до семи лет. Как известно, именно в этом возрасте дети с легкостью становятся двуязычными.

Исследователи пришли к выводу, что все дело в звуках, ведь каждый язык — это прежде всего уникальный набор фонем. С рождения дети могут различать любые звуки, а к тому моменту, когда они начинают говорить, эта способность начинает снижаться и затем пропадает.

Например, взрослые японцы не различают звуки «р» и «л», однако семимесячный японский ребенок дифференцирует их так же хорошо, как и американский. Когда звучит «р», ребенку показывают игрушку с одной стороны, а когда произносится «л», — с другой. Младенец быстро понимает, куда надо смотреть, когда слышит тот или иной звук. В это время ученые сканируют его мозг.

Еще один странный момент, который давно занимает ученых, связан с тем, что дети осваивают оба языка одновременно: в возрасте одного года они произносят свои первые слова, а к полутора годам знают уже около пятидесяти слов на обоих языках. Исследователи провели эксперимент с 44 годовалыми малышами по принципу, описанному выше, только вместо одиночных звуков им предлагали бессмысленные слова из трех слогов («лобало» и «лолоба»). Двуязычные дети смогли «выучить» оба слова, одноязычные оказались на это не способны.

Очевидно, что мозг двуязычных детей развивается быстрее. Детали экспериментов освещены журналом Science. http://www.sciencemag.org/ http://finance.yahoo.com/news/Unraveling-how-children-apf-2395944604.html?x=0&.v=1

AiBollid
03-04-2011, 10:31 PM
04-MAR-2011_77... ( http://www.izvestia.ru/news/news217451 )
06-OCT-2009, XXI век может оказаться последним для 3000 языков: почти половина языков, на которых сегодня говорят на планете, может исчезнуть из обращения уже в этом столетии... ...

AiBollid
03-04-2011, 10:36 PM
07-MAR-2011_78... ( http://www.infox.ru/science/human/2009/10/09/literacy_brain.phtml )
15-OCT-2009... Обучение грамоте приводит к резкому увеличению мозга: Пока человек учится читать, у него увеличивается объем и серого, и белого вещества мозга.

Более того, ученым удалось найти в мозге зону предвидения: она предугадывает слово, в которое мы только начали вчитываться.

Уникальное исследование смогли провести ученые благодаря бывшим колумбийским партизанам, k-e осваивают грамоту уже во взрослом возрасте пo государственной социальной программе..

Говорить и читать – принципиально разные умения: Речь -- уникальная способность человека. Она эволюционировала в течение приблизительно 6 млн лет, с того времени как разделились ветви гоминид и шимпанзе.

Структуры мозга, связанные с речью, специфичны для человека. Анатомическая основа речевых способностей есть у каждого, даже если он растет в неблагоприятной для развития среде.

Иное дело – способность читать. Овладеть чтением невозможно без специального обучения.

Найти области мозга, вовлеченные в процесс обучения чтению, нелегко. Дело в том, что когда ребенок учится читать, он овладевает и массой других навыков -- например, умением считать, плавать и другими.

А мозг его в это время еще активно развивается. И невозможно отделить одни изменения от других. Поэтому возможность изучить, как обучается чтению взрослый человек, очень ценная. Грамотность развивает и серое, и белое вещество.

Оказалось, что у грамотных партизан по сравнению с неграмотными в нескольких областях коры увеличен объем серого вещества: в обоих полушариях это дорзальные затылочные зоны (связаны с обработкой зрительной информации), в левом полушарии - верхние височные зоны (связаны с обработкой звуков), угловая извилина и задние средние височные зоны (связаны с семантическими процессами).

Очевидно, говорят ученые, эти области, взаимодействуя между собой, обеспечивают распознавание формы букв, перевод букв в соответствующие звуки и придание им значения.

Изменения коснулись и белого вещества мозга. Его толщина у грамотных испытуемых по сравнению с неграмотными увеличена в валике мозолистого тела (это основной пучок проводящих путей, связывающий правое и левое полушария мозга). Более развиты у них оказались и внутриполушарные проводящие пучки левого полушария, связывающие угловую и дорзальную затылочную извилины коры мозга. Это показывает, что обучение чтению облегчает связи полушарий между собой, а внутри ключевого левого полушария – связи зон обработки зрительной, слуховой и семантической информации.

Для чтения важно не просто видеть, а предвидеть...

Особенно интересна для ученых оказалась роль угловой извилины.
То, что она имеет прямое отношение к обучению чтению, известно уже давно. Теперь же исследователи уточнили ее роль.

«Мы считали, что угловая извилина работает как словарь, переводящий буквы в значения, - объясняет профессор Кэти Прайс
– Но!
оказалось, ее роль в том, чтобы предвидеть значение слова, которое мы видим глазами ».

Она сравнивала извилину с системой набора текстовых сообщений на мобильном телефоне, предвидящей слово, которое мы хотим написать...

...Статья о том, как отличить грамотный мозг от неграмотного, появится в Nature 15 октября 2009

AiBollid
03-04-2011, 10:38 PM
04-MAR-2011_79...
The Stuff of Thought: Language as a Window into Human Nature (Paperback)
by Steven Pinker,
$10.40, used from $4.74, Paperback: 512 pages,
# ISBN-10: 0143114247

Любимец Наума Хомского-Чомского,
соавтор его идей о врожденном языке Кроманьенцев,
неутомимый исследователь 33 неизвестных языках индейцев Амазонии.. в порочных связях с Че Геварой не замечен
ввиду безвылазной жизни в кэмбриджском кампусе МИТа

AiBollid
03-05-2011, 01:18 PM
05-MAR-2011_01 ( http://www.ng.ru/science/2009-10-14/9_new_words.html )
14-OCT-2009_A... Oshchushchenie языка: Когда общество не порождает новых слов, оно вообще мало что порождает! В сентябре на рекомендательном сайте Имхонет был создан клуб «Слово», ориентированный на развитие русского языка: словотворчество, заполнение лакун в языке, замену неблагозвучных, корявых неологизмов и т.д.

Куратор клуба – филолог, философ, профессор теории культуры университета Эмори (Атланта, США), руководитель Центра творческого развития русского языка Михаил Эпштейн. Предлагаем беседу Михаила Эпштейна(-M-) с Александром Долгиным (-A-), заведующим кафедрой Прагматики культуры ГУ-ВШЭ, управляющим рекомендательным сервисом Имхонет.

Беседа началась с заявления Михаила Эпштейна: «Русский язык скукоживается: сократился словарный запас…»

// Михаил Эпштейн – философ, филолог, культуролог, литературовед, эссеист. Член российского ПЕН-клуба и Академии российской современной словесности. Автор свыше 20 книг и более 500 статей и эссе, переведенных на 15 иностранных языков. С 1990 года живет и работает в США. Профессор университета Эмори (Атланта)... ... ...

AiBollid
03-05-2011, 01:24 PM
05-MAR-2011_01 ( http://www.ng.ru/science/2009-10-14/9_new_words.html )
14-OCT-2009_B... Oshchushchenie.. cont:
-M- «Русский язык скукоживается: сократился словарный запас…»

-А- Александр Долгин (-А-): Мне казалось, что русский язык достаточно богат, чтобы передавать самые тонкие смыслы…

-M- Михаил Эпштейн (-M-): Носителям языка он всегда кажется самым богатым. Однако при сравнении двух или нескольких языков картина меняется. Например, английский лексически богаче русского (по разным подсчетам – в 3–5 раз!). Даже англо-русские словари, как правило, содержат больше входных слов, чем русско-английские. Лишь один факт – в русском языке не используются тезаурусы (собрания слов по тематике). В английском языке – это настольная книга, им пользуются наравне с обычными словарями.

B русском языке не набирается такое количество синонимов и родственных понятий, чтобы образовать тезаурусные ряды. Каждое «тематическое гнездо» в основном представлено одним-двумя словами, тогда как в английском или немецком их значительно больше.

-A- Да, похоже, объективные симптомы – и неутешительные. Язык важен даже для геополитической конкуренции народов. Про культуру, как элитарную, так и массовую, и говорить нечего. Вероятно, когда общество не порождает новых слов, оно вообще мало что порождает.

-М- В целом ряде стран – США, Франции, Германии, Японии – целенаправленно работают над развитием и самосознанием языка. В частности, проводятся акции «Слово года» и «Антислово года» (самое лживое, пропагандистское). В США этим занимается Американское диалектное общество, в которое входят крупнейшие лингвисты, журналисты, педагоги. С 2007 года я провожу такой конкурс в Центре творческого развития русского языка при Международной ассоциации преподавателей русского языка и литературы. Словами минувшего, 2008 года, стали «кризис», «коллайдер» и «великодержавность». В 2007 году лидировали «гламур» и «нано», включая «нанотехнологии», и «блог/блогер».

В разряде жаргонизмов и неологизмов на первое место в прошлом году вышло слово «пазитиф» – чуткая реакция языка на повсеместное навязывание позитива. На второе место – «обаманна» – представление о том, что с приходом Обамы к власти с неба посыплется манна небесная. Одновременно в нем звучит «обман». Третье место заняло слово «стабилизец». А выражением года было названо «пилинг и откатинг».

В этом году на статус «Слово года» претендуют: «новые бедные», «перезагрузка», «антикризисный», «обвал», «передел», «пере-» (приставка, означающая радикальные перемены)...

Выбор знаковых слов – это рефлексия общества над тем, что составляет основной нерв минувшего года. Поэтому «Слово года» – акция, имеющая важное общественно-языковое значение. Было бы интересно провести ее на Имхонете – мы получили бы не только экспертное, но и читательское мнение. Вдобавок к прочитанным в прессе люди могли бы присылать слова собственного сочинения или услышанные где-то... ...

AiBollid
03-05-2011, 01:30 PM
05-MAR-2011_01 ( http://www.ng.ru/science/2009-10-14/9_new_words.html )
14-OCT-2009_C... Oshchushchenie.. cont:
-А- Имхонет, действительно, удобная площадка для работы со словом, поскольку это сайт новейшего поколения, так называемый web 3.0. То есть к распространенным технологиям web 2.0, когда контент находят и создают сами пользователи, добавляется следующая важнейшая фаза, когда они сами же его сертифицируют. Таким образом, люди будут не только генерировать слова, но и проявлять свое отношение к ним. Это поможет выявить перспективные слова – их подхватят и разнесут, поскольку они легли на душу.

-М- Помимо «Слова года» целесообразно провести конкурс «Словотворчество» – на создание или введение в широкий оборот новых слов и понятий. Велимир Хлебников создал неологизм «языковод» – тот, кто выводит слова, как садовод цветы. К сожалению, я не раз сталкивался с тем, что деятельность, сознательно направленная на создание новых слов, вызывает чуть ли не осуждение. Бытует мнение, что язык как-то сам собой рождается в народной толще.

-А- Это касается не только языка. Безымянность вообще типична для социальных практик. Кто помнит, что детский сад придумал Оуэн? Или что Пастер потратил не один десяток лет, объясняя, зачем мыть руки… Публичные опыты ставил и чуть ли не спектакли с душераздирающим концом разыгрывал, чтобы внедрить новую норму. Универмаг – крупное социальное изобретение – был впервые открыт в Милане. Все когда-то было чьей-то инициативой, чьей-то целенаправленной деятельностью, а кажется возникшим само собой.

-М- В 1920–1940-е годы лексический фонд русского языка, по крайней мере в его словарном отражении, уменьшился примерно в 2–3 раза в результате выбывания (и выбивания) культурного слоя, который его практиковал. Распространился новояз.

==> Новояз – это не творческое обновление языка, а сокращение, когда лишние, «вредные» слова, вызывающие свободное движение мысли, прореживаются, а остальные сводятся к двум значениям – «за» и «против». Русский язык истощился до такой степени, что творческая, проективная задача выходит сейчас на первый план.

Парадокс, но наиболее активным сообществом, формирующим язык в последние десятилетия, оказалось криминальное. Практически только оттуда приходят новые слова: «беспредел», «разборка», «отморозок», «наезжать», «распальцовка»... Сообщества журналистов, писателей, мыслителей, интеллигенции в широком смысле стесняются языкотворчества и пассивно ждут, когда народ начнет обогащать язык, как будто они сами не народ или в меньшей степени народ, чем уголовники.

-А- Думаю, одна из причин – в смене элит. Интеллигенция держится за язык, справедливо видя в нем маркер принадлежности к своим. Бизнес-элита еще не настолько раскованна в поле культуры, чтобы публично экспериментировать со словом.

Но, может быть, ситуация не столь драматична, как следует из ваших слов: пока словарь сокращается, нарастают другие знаковые системы? Визуальные, или, возможно, добавляется интонационная выразительность… Может быть активность перетекает в графику? Если наравне с сокращением одной системы растет другая, то на круг мы ничего не теряем.

AiBollid
03-05-2011, 01:38 PM
05-MAR-2011_01 ( http://www.ng.ru/science/2009-10-14/9_new_words.html )
14-OCT-2009_D... Oshchushchenie.. cont:
-M- За введением новых знаков, в том числе графем, – будущее. Пример неографии – как передать состояние «горя» и его степень? Можно рядом кавычек – словно слезы: """""""". Еще одна типичная эмоция – знак «крыша поехала»: ^> Именно так она и съезжает: крыша, которая наверху, оказывается сбоку. Значение: «с ума они там посходили?», «совсем свихнулись» и т.п. Насколько такие знаки могут войти в употребление, оказаться «входчивыми»?

Но неографика не отменяет неологии – необходимости расширять словесный язык, запас его лексических и концептуальных средств. Вот, кстати, «входчивый» – пример нового слова. Есть ведь такие входчивые люди, которые могут войти в любые двери, переступить любые социальные пороги. Хорошо бы протестировать его на Имхонете, насколько оно «входчиво» в язык. Как и другие слова. Например, слово «глокальный» – оно было придумано в Японии в 1990 году, в нем объединено глобальное и локальное. Война в Ираке была глокальной.

-А- Интернет в целом и Имхонет в частности располагают отличной базой для такого рода аналитики… Там собирается информация о реальных (а не предполагаемых) предпочтениях людей, есть оценки и описания миллионов объектов, и все суждения имеют персональную привязку. Благодаря этому можно получать любые срезы: социодемографические, гендерные, вкусовые... В системе зарыто колоссальное количество ответов на эти и другие незаданные вопросы.

- М- Вам карты в руки, потому что я не математик. Хотя у меня вышла работа «Мысли в числах. Россия и Запад в зеркалах Интернета». Из разноязычного Интернета вырисовывается очень показательная картина. Например, в Рунете имя Шекспира употребляется гораздо чаще, чем Пушкина или Достоевского в Ангнет – аглоязычном Интернете. Но если посмотреть на популярность Пушкина внутри русской культуры и Шекспира внутри английской культуры, Пушкин окажется выше – он упоминается на каждой 38-й странице Рунета, а Шекспир – на каждой 216-й странице Ангнета, что статистически подтверждает наш литературоцентризм.

Я, кстати, пробовал вычислить таким путем объем Рунета и Ангнета… Известно, что в русском языке предлог «в» – самое частое слово (встречается 1 раз на каждые 23 слова): в английском это определенный артикль the (каждое из 16 слов). Таким образом, достаточно взять частоту употребления этих слов, умножить на 23 или на 16 – и можно получить приблизительный объем Рунета и Ангнета. Получается, что англоязычный Интернет по объему слов примерно в [u]50 раз больше, чем Рунет[/b].

Но насколько точна эта статистика? Я беседовал с людьми из Google, из Силиконовой долины, они говорят, что цифры не совсем надежны. Кроме того, время от времени показатели меняются. Если бы удалось наладить точный сбор сетевой статистики, мы приобрели бы неоценимые социологические данные. Например, как соотносятся в английском и русском языках такие понятия, как man и woman, «мужчина» и «женщина»? Цифры сразу позволили бы оценить сравнительные масштабы феминизма.

Или такой факт: судя по Google, Россия сейчас занимает 13-е место среди держав, интересующих англоязычный мир. Она идет после Мексики, Кореи, Бразилии, Израиля, чуть выше, чем Иран, Индонезия и Турция. Я ориентируюсь на количество «гугликов» – сколь часто, по данным Гугла, слово «Россия» употребляется в англоязычном Инете. Кстати, каждый из нас может поинтересоваться, сколько у него гугликов.

-А- Частота упоминания как способ измерения символического капитала…

-М- Статистика слов по их частоте употребления в Инете – серьезный ориентир в оценке общественной важности тех или иных явлений. Например, кто главный философ в сознании Запада и России? Судя по данным Google, все еще Маркс, причем на Западе тоже. Потом Энгельс. И лишь затем идут Кант, Сократ, Платон, Аристотель, Ницше (в таком порядке).

-А- Запросов к Сети и рекомендательным сервисам можно сформулировать сколько угодно. Но хорошо бы точнее определиться с тем, что на самом деле важно узнать. Постановка точных вопросов к Интернету – это отдельная и не сказать чтобы решенная задача... ... ... ...

AiBollid
03-05-2011, 01:41 PM
05-MAR-2011_01 ( http://www.ng.ru/science/2009-10-14/9_new_words.html )
14-OCT-2009_E... Oshchushchenie.. cont:
-М- Я ввел слово «гуманетика» – гуманитарные исследования посредством Сети. Интернет позволяет понять, что значит, например, дуб для немецкого языка и что – для русского. Что важнее для русского менталитета – дуб или береза, то есть женственное (белое, кружевное) или мужеское (кряжистое, могучее). Не воспользоваться новыми сетевыми возможностями было бы грандиозным упущением лингвистики. Инет позволяет определить вес слова в ментальности народа и тем самым точнее охарактеризовать саму ментальность.

-А- Не забудем, что Интернет удобен не только для рефлексий по поводу языка, это еще и среда, в которой рождаются новые слова. Можно подстегнуть этот процесс. Например, обработать дневниковые записи и вытащить характеристику словарного запаса, которым оперируют блогеры. Рейтинговать их по этому показателю. Это поможет выцепить и вывести на поверхность перспективные слова.

-М- Это очень продуктивная идея. Даже Словарь Даля в значительной мере был проективным – Даль попытался ввести огромное количество слов (около 14 тысяч). Правда, будучи сыном своего позитивистского времени, он стеснялся этого. Тогда было принято считать, что ученый отражает существующее в реальности, а не проектирует то, что ему кажется возможным.

Еще одна попытка: Солженицын издал Словарь расширения русского языка. Это благородный замысел, но в издании нет практически ни одного нового слова, это конспект по словарю Даля – напоминание о словах домотканого быта, ремесел, которые полезно помнить.

Гумбольдт, основатель научного языкознания, говорил, что язык – это не готовый продукт, «эргон», а энергия, творческий процесс рождения слов и смыслов. Словотворчество, как я его понимаю, ориентировано не на реанимацию конкретных слов, а на воскрешение энергии языка, способность корня рождать новые слова.

-А- Как вы относитесь к импорту слов?

-М- Ничего плохого в заимствованиях нет. Но если язык жив, он должен рождать новое и на своей собственной корневой основе. Именно так было в XVIII веке: в эпоху Петра и его преемников Россия много заимствовала из голландского, немецкого, французского, но одновременно шло интенсивное творчество на основе русских корней. Тогда появились слова «чертеж», «созвездие», «кислород», «промышленность», «чувствительность», «трогательный» и др. Их создавали Тредиаковский, Ломоносов, Карамзин, Шишков...

Если сейчас русский язык не ответит на вызов английских заимствований собственным словотворчеством, это будет означать смерть языка. При современной глобализации через несколько поколений люди начнут переходить с кириллицы на латиницу, потому что большинство русских слов будет логичнее и удобнее писать на латинице. «Бодибилдинг», «армрестлинг» или «мерчандайз» на кириллице выглядят чудовищно! Столь же чудовищно, как написанное латиницей слово «ощущение» – «oshchushchenie».

Каждый язык выбирает те графические средства, которые способствуют наилучшему представлению его слов. Если большинство слов в русском языке станут заимствованиями из английского, то и писать их будет удобнее на латинице. Придется Пушкина с Толстым переводить на латиницу. А это изменение всего культурного генофонда нации.

-А- В каких сферах жизни больше всего словесных лакун? Есть ведь очевидные бреши – слова, которые позволяют корректно поругаться, выяснить отношения, слова любви...

-М- Любовная лексика, безусловно, бедная, особенно в средней стилевой зоне, между матом и канцеляритом («сожитель»). Печальное наблюдение Марины Цветаевой: «Возлюбленный» – театрально, «любовник» – откровенно, «друг» – неопределенно. Нелюбовная страна!» А одна американская писательница придумала такое слово – «амари». С одной стороны, оно происходит от «амор» – «любить», с другой – «а-мари» – «не женат».

В русском языке мало слов, связанных со временем. В английском языке множество слов, особенно глаголов, производных от time. У нас всего два глагола – «повременить» и «осовременивать» – оба малоупотребляемые. Задумайтесь, всего два глагола с корнем «врем», который суть движение, изменение!

Не решена проблема обращения к мужчине или женщине. Нет устоявшегося названия электронной почты и электронного письма. Или еще пример – есть семейные пары, которые не хотят иметь детей. Их неправильно называть бездетными, потому что они не просто не имеют детей, но не хотят их – из принципа или из материальных соображений. Как их назвать? Противодетные? .. .. ..

AiBollid
03-05-2011, 01:44 PM
05-MAR-2011_01 ( http://www.ng.ru/science/2009-10-14/9_new_words.html )
14-OCT-2009_F... Oshchushchenie.. cont:

-А- То же с людьми, которые официально не работают. Это не тунеядцы и могли бы находиться при деле, но они не бедствуют и на жесткий потогонный график не согласны. Пока устоявшегося слова нет, а масса голов и рук маются от безделья.

-М- То есть дыр и прорех много. Хотя в русском языке есть и свои преимущественные зоны.

Скажем, в английском не различаются голубой и синий цвета, есть одно слово – blue и его оттенки: светлый, темный. Или «правда» и «истина» по-английски одинаково truth.

-А- А может, и хорошо, что у нас вместо пяти-шести английских слов одно русское. Изъясняться не числом, а умением. Если представить себе язык как классификацию, то, возможно, наша устроена чище и экономичнее. Она как декартова система координат – ничего лишнего[b]!!!

-М- К сожалению, это не так. [b]Язык движется от абстрактного к конкретному. В английском языке огромное число и общих слов, и конкретных, расчленяющих общую сферу. Например, по-русски есть одно слово «форма», причем оно пришло из латыни только в XVIII веке. А по-английски наряду с form, есть еще и shape, и mold.

То же самое с понятием вины. По-русски говорят «он виноват», а по-английски можно сказать – guilt, fault, blame. Blame – значит винить кого-то за конкретное неподобающее действие. Guilt – это нравственная вина. Fault – вина-недостаток, ошибка. То есть русскому приходится самостоятельно додумывать, о какой вине идет речь. А английский язык уже заранее проделывает эту работу, четко различает понятия, в результате чего можно сразу сконцентрироваться на индивидуальных оттенках и аспектах вины. Это и есть восхождение от абстрактного к конкретному.

-А- Значит, в английском сделана ставка на четкую разметку эмоционально-смысловых полей, а в русском больше отдается на додумывание, трактовку, человеческое творчество. Это как с законами: можно их принять и действовать по писаным правилам, а можно всякий раз решать на глазок.

«Скучные» на Западе люди. То ли дело, наш человек – одним топором такое сотворит, что у другого и с инструментом в жизни не получится.
Но ведь не все так могут!

AiBollid
03-05-2011, 01:58 PM
05-MAR-2011_03... ( http://lenta.ru/news/2009/11/12/alevel/ )
12-NOV-2009... Компьютер поставил Хемингуэю "тройку с минусом"
по английскому! Разработанная в США компьютерная программа, анализирующая тексты на английском языке, поставила Хемингуэю "тройку с минусом", назвав его язык стилистически и лексически небрежным, пишет 12 ноября The Times. Программа создается для автоматической оценки школьных сочинений. Руководитель Института оценок в системе образования (Chartered Institute of Educational Assessment, CIEA) Дэвид Райт (David Wright) заявил, что программа не сумела распознать стиль автора и замысел текста. По оценке программы, язык Хемингуэя не соответствует уровню британского школьного экзамена повышенной сложности (GCE Advanced Level, A-level - Прим. "Ленты.ру"). Программа также не оценила по достоинству знаменитую речь Уинстона Черчилля "The Finest Hour", произнесенную в Палате представителей в 1940 году. Компьютер пришел к выводу, что язык Черчилля страдает лексическими повторами, а также не распознал существительное "might" (англ. "могущество"), приняв его за неправильно употребленный модальный глагол "might have" (англ. "мог бы, могли бы"). Кроме того, программа не поняла отрывок из "Повелителя мух" Уильяма Голдинга - по ее выводу, структура предложений писателя ошибочна. Исследователи также проверили в программе первый абзац "Заводного апельсина" Берджесса, которого компьютер не понял совсем, назвав текст "невразумительным".

Как отмечает издание, в Великобритании машинной системы оценки сочинений пока не существует, но в США она уже действует. По словам заместителя главы CIEA Грэма Херберта (Graham Herbert), некоторые американские школьники научились обманывать компьютер и писать "понятным" для него языком. В связи с этим Херберт признал, что на данный момент надежного и точного способа проверить сочинения на английском языке с помощью компьютерной программы не существует.

AiBollid
03-05-2011, 10:28 PM
05-MAR-2011_05... ( http://lenta.ru/news/2009/11/12/speech/ )
12-NOV-2009.... Найдены ключевые для развития речи гены

Исследователи определили отличия в "работе" так называемого гена речи
- Foxp2 - у человека и шимпанзе. Эти данные в будущем помогут специалистам понять, как у людей развилась речь. Работа авторов опубликована в журнале Nature.

Ген Foxp2 привлек внимание ученых в 2001 году, когда было показано, что мутации в нем вызывают у людей серьезные расстройства речи.

Кодируемый этим геном белок FOXP2
является транскрипционным фактором,
то есть, он запускает работу других генов.

Белки FOXP2 у человека и шимпанзе отличаются
всего на две аминокислоты,
и тем не менее, обезьяны говорить не могут

AiBollid
03-05-2011, 10:40 PM
05-MAR-2011_07 ( http://www.3dnews.ru/news/pochemu_7_magicheskoe_chislo_dlya_mozga/ )
07-MAR-2010... Семь – "магическое" число для мозга

Невозможность вспомнить услышанный несколько минут назад номер телефона или список продуктов, которые нужно купить в супермаркете – это вовсе не обязательно признаки ослабления умственных возможностей или наступающей старости.

Далеко не идеальная память обусловлена природой.

Бесчисленные психологические эксперименты показали,
что в среднем максимальная длина последовательности, которую человек способен воспринять "на лету", характеризуется числом семь – семь предметов, цифр, образов и т.д.

Это ограничение, названное после открытия в 1950-х годах
"магическим числом 7", является средней ёмкостью рабочей памяти мозга. Теперь учёные представили модель активности мозга, объясняющую причину такого положения вещей.

Если долговременную память можно вообразить в виде библиотеки печатных книг, то рабочая память – это скорее классная доска, на которой часто выводится мелом и быстро стирается информация.

Проходящий через неё непрерывный поток мыслей может содержать грубые вычисления, а услышанный телефонный номер здесь же преобразуется в соответствующие цифры. Затем они могут быть, например, записаны на бумаге или использованы для логического ответа на некий вопрос.

Рабочая память незаменима во время беседы, для ориентирования в незнакомом городе и обучения новым танцевальным па.

Довольно легко проверить, сколько же способна вместить эта "классная доска". Нужно попросить кого-либо составить список из 10 слов или цифр, один раз просмотреть и попытаться воспроизвести увиденное.

Большинство людей запоминает до семи значений.

Чем длиннее запоминаемый список, тем более вероятны ошибки.
Но почему возможности мозга столь ограничены? ...

Когда произносится некое предложение,
при каждом следующем слове активизируется кластер из нейронов,
на мгновение подавляя другие и предотвращая тем самым путаницу.

В модели Рабиновича и Бика
возбуждение конкретного скопления клеток представляется как отдельная точка.

По мере последовательной смены слов
мозг создаёт путь от одной точки до другой.

Чем сильнее отдельный кластер подавляет остальные
и задерживает их возбуждение, тем более прочны данные пути.

При попытке вспомнить предложение - мозг следует своей же "карте"
от одного зафиксированного состояния активности до другого.

С увеличением длины предложения или ряда чисел
сложность сдерживания одним скоплением нейронов
==> остальных растёт экспоненциально,
и дорожки между ними слабеют.

Запоминание 7 значений
требует в 15 раз более сильного подавления,
чем в случае 3 значений..

AiBollid
03-05-2011, 10:54 PM
05-MAR-2011_08... ( http://science.compulenta.ru/589551/ )
25-JAN-2011... Длинные слова более информативны (?)

Сотрудники Массачусетского технологического института вывели эмпирическое правило, согласно которому основным фактором, определяющим длину слова, становится его информативность.

Лингвисты привыкли связывать длину слова с другой характеристикой — частотой его использования.

Кажется логичным,
что наиболее употребительные слова сокращаются с целью экономии времени ; такая закономерность, отмеченная в тридцатых годах ХХ века американским учёным Джорджем Ципфом, сохраняется в самых разных языках.

По мнению авторов новой работы,
определяющим фактором здесь становится всё же
не частота употребления, а информативность .

Гипотеза основана на следующем предположении:
объём полезной информации, которую может передать слово,
обратно пропорционален тому, насколько легко предсказывается появление последнего в тексте.

Оценить
«содержательность» конкретного слова чрезвычайно трудно,
так как она меняется в зависимости от контекста :
числительное «сто» во всем известном выражении «Лучше один раз увидеть, чем сто раз услышать» несёт меньшую смысловую нагрузку,
чем во фразе «Сегодня на улице я нашёл сто рублей»... ... ...

PS: На первом этапе работы исследователи установили частоту появления определённых пар слов в оцифрованных текстах. Полученную информацию использовали для вычисления вероятности того, что некое конкретное слово будет следовать за другим (или за последовательностью слов).
По результатам этих расчётов были присвоены оценки информативности.

Анализ текстов на 11 европейских языках
подтвердил истинность гипотезы:
наиболее короткие слова оказывались самыми [u]«предсказуемыми» и наименее информативными[/b].

(D) Полная версия отчёта будет опубликована в журнале Proceedings of the National Academy of Sciences.
Подготовлено по материалам Nature News.

AiBollid
03-05-2011, 11:05 PM
05-MAR-2011_05... ( http://www.cybersecurity.ru/prognoz/115064.html )
11-FEB-2011... С 1986 года человечество произвело
295 экзабайт уникальных данных: Впервые в истории
ученые оценили возможности человечества по хранению информации.

Исследование, результаты которого были опубликованы в научном журнале Science, говорят о том, что по состоянию на конец 2007 года в мире хранился общий объем информации в размере 295 экзабайт,
что составляет примерно [b]1,2 млрд жестких дисков[b], продаваемых сейчас на рынке...

Исследователи подсчитали, что для хранения всей информации, генерируемой человечеством, применяются около 60 технологий: от ПК и DVD-дисков до бумаги и различных экзотических форм хранения. "Если бы мы взяли всю информацию и начали хранить ее в книгах, то этими книгами в три слоя можно было бы уложить всю территорию Китая или США", - говорит доктор Мартин Хилберт, один из авторов исследования.

Впрочем, такого книжного изобилия не будет, так как по расчетам тех же специалистов, в 2007 году около 94% всех данных хранилось в цифровом виде - на жестких дисках, магнитной пленке, чипах памяти и оптических носителях. С учетом этого факта, можно говорить, что три года назад общий объем хранимых данных (исключая повторения, например копии одних и тех же книг) составлял 295 миллиардов гигабайт.

Если бы все эти данные были записаны на обычные DVD-диски, а потом эти диски выложить в дорожку, то получившаяся дорожка дисков могла бы достать до Луны и вернуться обратно.

Авторы отчета брали в расчет только данные, появившиеся в "цифровую эру", то есть с начала 1986 года, когда на столах появились первые персональные компьютеры, до 2007 года. Еще одной интересной тенденцией отчета стала "цифровая революция". По данным публикации, еще в 2000 году около 75% информации было в аналоговом виде, тогда как семь лет спустя - 94% информации были уже в цифровом виде.

"Ранее мировое общество изменило появление автомобиля, до этого - появление электричества. Сейчас таким драйвером изменений является информация. Примерно каждые 50 лет появляется нечто, что растет невероятными темпами и полностью меняет жизнеустройство",- говорит Хилберт.

Среди других интересных результатов исследования можно выделить данные о том, что в современном мире было передано около 2 зеттабайт (1 заттабайт = 1000 экзабайт) данных в год. Это включает в себя видеотрансляции, систем передачи данных, голосовое трафик в сетях, а также текстовую и графическую информацию.

Наконец, авторы отчета уверяют, что самым быстрорастущим показателем современного мира является вычислительная мощность компьютеров, которая ежегодно увеличивается примерно на 58%. "В 2002 году люди в развитых странах передавали данных в восемь раз больше, чем в развивающихся. В 2007 году - уже в 15 раз больше", - говорится в отчете.

AiBollid
03-05-2011, 11:30 PM
05-MAR-2011_05.. ( http://www.inauka.ru/analysis/article105243.html )
23-FEB-2011_A.. [b]Имплатанты-Интерфейсы с мозгом
для Усиления Интеллекта: После полной потери слуха в 2001 году Dr Майклу Хоросту хирургическим путем был вживлен в голову кохлеарный имплант, проще говоря, компьютер. Благодаря чему ученый смог продолжить работу в университете, его мозг научился переводить шумы в сигналы, расшифровывать речь, музыку.
В своей новой автобиографической книге "Всемирный разум", выходящей в марте в издательстве "ЭКСМО", Майкл Хорост исследует проблему соединения человеческого разума и технологии.

Наука шагнула далеко вперед, научившись вживлять в голову человека компьютер. Но не исчезнем ли мы благодаря такому развитию технологии во Всемирной сети разума, утратив личное общение с себе подобными? "Неделя" приводит главу из книги:: Многое из того, что связано с сознанием, хранится в закодированном виде в мозге и, следовательно, может быть легко расшифровано и приведено в активное состояние. Мы узнаем мелодии независимо от тональности или инструментальной обработки. Для нас при этом важны не абсолютная высота звука или тембр, а музыкальная схема, которой соответствуют проигрываемые звуки.

Мы узнаем лица людей независимо от уровня освещенности, расстояния или угла зрения.

Узнаем речь, несмотря на акцент, ритм или громкость.

Многие нейроученые полагают,
что мозг человека хранит инвариантные репрезентации каждого подобного явления, позволяющие нам улавливать суть
- какими бы ни были ее поверхностные разновидности.

Для активирования этих репрезентаций требуется совсем немного.

Например, когда вы видите вспышку молнии, мозгу, чтобы идентифицировать последнюю, не нужно много времени для анализа ее размера, формы, цвета, положения в пространстве и так далее.

Ему достаточно ухватить ее часть - общую форму, которая и служит ключом к восприятию.

Зрительный сигнал, относящийся к частичному образу объекта, возбуждает несколько нейронов, с которыми связана вся группа, отвечающая за инвариантную репрезентацию, - и вся цепь нейронов активируется полностью.

Это явление называется авто-ассоциацией: возбуждение части блока памяти активирует весь блок. Разобраться в этом механизме помогает теория Дональда Хебба:

Совместно возбуждающиеся нейроны тесно связаны между собой и расположены в непосредственной близости друг от друга.

Далее, каждый объект
представляется в мозге
специфической конфигурацией нейронов и их синаптических связей.

Поскольку у каждого нейрона есть тысячи синапсов,
для хранения знаний существует огромный объем
- посредством ассоциирования каждого объекта
с уникальной конфигурацией синапсов в группе нейронов.

Тем не менее
не стоит уподоблять человеческий мозг почтовому отделению,
в котором приходящие сообщения раскладывают
исключительно по абонированным ящикам.. ... ...

AiBollid
03-05-2011, 11:39 PM
05-MAR-2011_05.. ( http://www.inauka.ru/analysis/article105243.html )
23-FEB-2011_B... cont: В концепциях
не все столь уж красиво разложено по полочкам...

Нейроны, участвующие в создании
инвариантных репрезентаций, частично накладываются друг на друга[b].

[b]Один и тот же Нейрон
может служить частью многих воспоминаний и концепций.

Более того, они могут соотноситься друг с другом иерархически.

Допустим,
наш мозг имеет нейронную цепь,
ассоциированную с общим представлением о собаке,
- концепцию "собака".

Однако он располагает и цепями, относящимися к столь концептуальным представлениям, как "немецкая овчарка" и "чихуахуа".

Каждое из трех представлений четко отличается ото всех прочих,
однако многие нейроны в них используются, так сказать, совместно (...).

Компьютеры весьма слабо справляются с дедуктивными задачами
и необходимостью приходить к определенным заключениям (Reasoning) о сложившихся отношениях.

Разработчик программ (?xa-xa) Джефф Хокинс аргументированно утверждает,
что требовать от машин выполнять подобные операции - ошибочный путь.

"Правильные" компьютерные программы ведут анализ,
следуя принципу "от общего к частному",
и пытаются соотносить объекты, опираясь
на их заданную классификацию в иерархическом порядке.

Мозг человека, напротив,
выводит свои заключения об отношениях очень быстро и эффективно: незнакомый объект сравнивается с наиболее соответствующим ему прообразом, который уже "записан" в нейронных цепях.

Например, собака незнакомой породы быстро распознается нами именно в качестве собаки, поскольку нейронная репрезентация собачьих свойств и признаков в нашем мозге - собирательный образ - может быть легко ассоциирована с любым объектом собаковидной формы (...).

Социологи установили,
что "сообщение" может быть доставлено к заинтересованному в нем получателю
- в каком бы месте мира тот ни находился
- с помощью цепочки, состоящей в среднем всего лишь из шести человек.

Мозг устроен похожим образом.
Некоторые нервные клетки "общаются" с ближайшими соседями,
другие же протягивают нити своих аксонов достаточно далеко,
достигая иных областей. Подобные устремленные вдаль соединения служат залогом того, что любая поступающая извне сенсорная информация имеет все шансы быстро дойти до тех нейронов, которые должны ее идентифицировать (...). .. ..

AiBollid
03-05-2011, 11:47 PM
05-MAR-2011_05.. ( http://www.inauka.ru/analysis/article105243.html )
23-FEB-2011_C... cont: Таким образом,
чтобы правильно интерпретировать активность мозга,
нужно создать компьютер, который бы мыслил как мозг.
Подобно нему, такая машина должна иметь множество блоков памяти, организованных в соответствии с принципом малых сетей.

Должна уметь строить
инвариантные репрезентации и, используя их, вызывать автоассоциации.

И наконец,
уметь предвидеть и сравнивать свои прогнозы
с сенсорной информацией, поступающей благодаря непосредственному опыту общения с окружающей средой.

Прогнозирование подобного рода
должно служить основой для формирования воспоминаний
и перцептивных моделей,
а также для деятельности высшего уровня.
То есть для создания гипотез и объяснения того,
каким образом складываются взаимосвязи между нейронами
в соответствующих цепочках.

Кроме того, компьютер будущего, который мы имеем в виду,
должен - основываясь на анализе
проводимых в течение определенного времени наблюдений
и с учетом требований постоянной самокоррекции
---- уметь создавать самые сложные и изощренные модели ментальной деятельности.

Креативные усилия
- такие как, например, создание гипотез - сегодня компьютерам недоступны.

Однако Хокинс (...)
не видит никаких теоретических препятствий для создания такого компьютера,
который воспроизводил бы нейронные структуры, отвечающие в головном мозге за предвидения и предсказания.

Инженеры в США
уже начали широкомасштабные эксперименты
по разработке микросхем (чипов),
архитектура которых подобна организации нейронных цепей.

В Стэнфорде, например, исследователи
уже создали "нейроморфический микрочип",
самоорганизующаяся схема которого
подобна зрительной коре лабораторных животных.

AiBollid
03-05-2011, 11:50 PM
05-MAR-2011_05.. ( http://www.inauka.ru/analysis/article105243.html )
23-FEB-2011_D... PS: Запчасти для головы (НАУЧНЫЙ ВЗГЛЯД):
В одном из рассказов Станислава Лема автогонщик постоянно попадает в аварии, и ему заменяют исковерканные части и органы тела на искусственные. Железные руки-манипуляторы, искусственное сердце, металлические заплатки на черепе. В конце концов от органического тела не остается ничего, и хозяева его "конюшни" требуют признать гонщика своей собственностью, а не нанятым сотрудником. В рассказе есть важное упущение, о котором Лем, разумеется, знал, но для развития идеи пренебрег. Можно заменить руки-ноги, почки-печень, сердце и пищевод с прямой кишкой, но искусственного мозга не существует и скорее всего создано не будет.

Никакого "компьютера" в мозг Майклу Хоросту не вживляли.
Его мозг снабдили всего лишь, хотя и это фантастическое достижение медицины, набором электродов, на которые подавали невысокое напряжение, и автору оставалось только запомнить, что вот такой укол - буква "а", а вот такой - "б". Понятно, что научиться слышать таким образом нелегко и вряд ли получится быстро, но ведь и дети в конце концов учатся вычленять из родительского гула слова "пора баиньки" и "прекрати вопить".

Традиционное сравнение головного мозга человека с компьютером
- примерно то же самое, что сравнение пассажира трамвая с самим трамваем.
Пассажир - он человек, едет куда ему хочется, может вообще из трамвая выйти и пройтись пешком, может заплатить, а может проехаться зайцем. Трамвай едет быстрее, чем идет пешеход, но по единственно доступному ему маршруту, да и вообще делать ничего другого не умеет.

Увеличивай память компьютера хоть в миллиард раз,
разработай для него хоть самую хитроумную программу
- вне заданных в ней алгоритмов наш железный друг ничего сделать не сможет.
А у человека есть (хотя и не при всех режимах) свобода воли,
не говоря уже о такой непонятной штуке, как интуиция.
Можно ли представить себе компьютер с интуицией?

Так что со временем наверняка придумают устройства,
которые дадут возможность слепоглухонемому капитану дальнего плавания управлять фрегатом, орать на матросов и стрелять в глаз сомалийского пирата, не попортив шкурку. Но не научат его скучать по оставшейся в кейптаунском порту невесте, сочинять про "дядю самых честных правил" и одалживать сотню приятелю, понимая, что деньги пропали.

Могут возразить, что ничего не мешает изготовить такой... ну хорошо, пусть называется компьютером, полностью аналогичный человеческому мозгу прибор.

Сделать это можно будет после того, как нейрофизиологи разберутся с принципами работы мозга. Возражение не принимается, потому что никогда этого не будет. Тайна работы мозга - это и есть тайна Творения. И раскрыть тайну мог бы только Творец.
А поскольку в материальном обличье Его не существует и людей создало не Нечто,
а Время, то и спросить не у кого.

Хотя нейрофизиологические исследования нужно продолжать и даже обильно финансировать.
http://www.inauka.ru/analysis/article105243.html From Пётр ОБРАЗЦОВ

AiBollid
03-06-2011, 09:20 AM
06-МАР-2011_02.... ....( http://science.compulenta.ru/597993/ )
05-МАР-2011 Cистема intendiX набирает текст «силой мысли»:CeBIT-11
Австрийская компания Guger Technologies показала в действии систему intendiX, позволяющую взаимодействовать с компьютером «силой мысли». Демонстрация проводилась на выставке CeBIT 2011. Работа системы основана на принципе электроэнцефалографии (ЭЭГ): на голову пользователя надевается шапочка с электродами, регистрирующими электрические сигналы мозга.

Потом информация через усилитель поступает на обработку в компьютер,
где анализируется и интерпретируется при помощи специального программного обеспечения.

intendiX позволяет набирать текстовые сообщения,
которые затем могут быть воспроизведены синтезированным голосом или отправлены по сети.

Во время работы на экран выводится таблица букв и цифр,
и для ввода нужного символа пользователю необходимо сконцентрировать на нём внимание.

После тренировок испытуемым удавалось довести скорость «печати» до 0,9 символа в секунду. А вот неопытный пользователь на ввод одной буквы может потратить до минуты.

В перспективе intendiX могла бы использоваться в качестве [b]средства общения парализованных людей[b] с внешним миром. Не исключено, что у разработки Guger Technologies найдутся и другие области применения...

AiBollid
03-07-2011, 05:48 PM
07-MAR-2011-01.... ( http://lenta.ru/news/2008/10/1​3/five/ )
13-OCT-2008.. 5 искусственных собеседников провалили тест Тьюринга:
Все пятеро программ - искусственных собеседников, участвовавших в конкурсе Университета Ридинга, провалили тест Тьюринга, передает BBC News. Для победы требовалось, чтобы судьи приняли программу за человека хотя бы в 30 процентах случаев. Разговор человека и машины длился всего пять минут.

Прошедшие тесты были частью восемнадцатой премии Лебнера (Loebner Prize), вручаемой ежегодно авторам лучших искусственных собеседников.

Первый результат в нынешней проверке, 25 процентов, показала программа Elbot, пишет The Guardian. Программа обманула 3 из 12 судей, отмечает Associated Press. Создатель Elbot, Фред Робертс, несмотря на поражение, получит премию в три тысячи долларов.

Изначально в конкурсе должны были участвовать шесть программ, однако искусственную собеседницу Alice не смогли вовремя настроить, и она выбыла.

PS: Тест Тьюринга предложен в пятидесятых годах британским математиком и криптографом Аланом Тьюрингом в качестве ответа на вопрос "Может ли машина мыслить?". Тьюринг считал, что точного ответа быть не может, но [b]если человек в ходе переписки сочтет собеседника-машину также человеком, то можно считать данную программу "мыслящей"[b].

До сих пор ни одна программа не смогла пройти тест Тьюринга. Сам математик считал, что к 2000 году программы смогут проходить тест в 30 процентах случаев.

AiBollid
03-11-2011, 09:24 AM
11-MAR-2011-21... ...( http://science.compulenta.ru/598549/ )
10-MAR-2011... ...Оперативная память человека состоит из 3 областей.. Исследователи из Университета Райса и Технологического института Джорджии (США) выступили в поддержку гипотезы о том, что мозг располагает тремя слоями оперативной памяти.

Учёные обнаружили,
что кратковременная память и впрямь состоит из трёх областей:

1) ядра, концентрирующего основное внимание на одном элементе;

2) прилегающей к ядру области, удерживающей внимание на трёх других элементах;

3) обширной периферии, содержащей пассивные элементы, которые были помечены для последующего извлечения.

Но! что ещё важнее, выяснилось:

ядро (то есть центр внимания)
обладает тремя функциями, а не двумя, как считалось.

На основании входящих данных оно (ядро) выбирает тот элемент,
на который стоит обратить внимание. Затем извлекает его и при необходимости обновляет.

Эксперимент, проведённый Чандрамалликой Басак и Полом Верхагеном, состоял из простых задач на проверку памяти.

Их предыдущие изыскания показали, что
время, затрачиваемое центром внимания
на переключение с внешнего на внутреннее и наоборот,
не зависит от количества запоминаемых элементов,
если они идут в предсказуемой последовательности.

В ходе нового исследования выяснилось,
что при отсутствии порядка время ответа увеличивается
в среднем на 240 мс с каждым новым запоминаемым элементом.

По всей видимости,
именно столько времени требуется на поиск возможных соответствий.

Второй эксперимент показал, что при должной тренировке (в данном случае она занимала десять часов) человек может хранить в центре внимания
четыре элемента сразу — но только если между ними есть связь.

Иными словами,
предсказуемость запоминаемых элементов
существенно повышает способность к многозадачности.

К примеру, если вы
ведёте машину по вызубренному маршруту в магазин,
---- вы успеваете обдумать список покупок.

Исследование показало также,
что третий слой оперативной памяти не только отделён от двух других, но! и отгорожен от них неким барьером. Количество содержащихся в нём пассивных элементов не влияет ни на время, ни на точность извлечения из памяти активных элементов.

Результаты исследования опубликованы в издании Journal of Cognitive Psychology. Подготовлено по материалам EurekAlert!.

AiBollid
03-11-2011, 09:40 AM
REF TO:
11-MAR-2011.. ..Оперативная память человека состоит из 3 областей..
FROM AiBOLLID:
Весьма полезная нт-читателю ньюс об организации памяти..
правда обойден вопрос об магическом числе 7,
о пассивных элементах..

Но есть временные характеристики необходимого
минимального времени реакции чел-маш системы - .25 - .75 сек..

Радует что нейросайентисты таки начинаю рассуждать в терминах "контекстной зависимости" и "устойчивых сочетаний"

AiBollid
03-12-2011, 05:21 PM
Пользуясь моментом,
доношу, что не-только для блондиног
- но и для анти-антисемитов - подготовлена подборка
не-секретных публикаций с основных российских новостных лент
на тему Кибер-Бессмертия, Роботов в быту, и Симбиоза Человека с Планетарным Искусственным Интеллектам..

Я это называю ИИ/НЦ.. (Новая Цивилизация)..

1) subj: Вестник ИИ: AI/NLP/Semantic-Web и Киборги
http://forum.russianamerica.com/f/showpost.php?p=4759832&postcount=1

2) subj: Robotics: Вести с полей.. сражений..
http://forum.russianamerica.com/f/showpost.php?p=4762852&postcount=1

3) subj: AI/NLP/KE - Beсти: Язык-Мышление-ВиртРеальность..
http://forum.russianamerica.com/f/showpost.php?p=4767224&postcount=1

4) subj: НЦ: Вести Британских Учоных для Всех
http://forum.russianamerica.com/f/showpost.php?p=4761066&postcount=1

К сожалению,
Др Курцвeйль - пока строит МММ..
продавая завтрашнее Бессмертие за живые деньги..

Поэтому - полный цимес от этой тематики
----- смогут получить только --- участники
живого общения с нашим Добрым Айболлитом

AiBollid
03-12-2011, 06:42 PM
12-MAR-2011_61.. ( http://gazeta.ru/science/2011/03/11_a_3551557.shtml )
11-MAR-2001_A... .... Лауреатом премии Тьюринга,
в этом году стал проф Гарварда Dr Лесли Вэлиант
– компьютерный теоретик, предложивший новаторские подходы
в разработке систем искусственного интеллекта,
самообучающихся алгоритмов, интеллектуального поиска
и программ распознавания образов, письма и речи

Эту компьютерную «нобелевку»-2010 год вручили Вэлианту
за «вклад в теорию алгоритмов, включая теорию приближенно правильного обучения (PAC), теорию сложности перечисления и алгебраических исчислений, а также теорию параллельных и распределённых вычислений».

Звучит заковыристо, но на самом деле с практическими воплощениями этих теорий в той или иной форме регулярно имеет дело каждый пользователь компьютера, электронной почты и цифровых "мыльниц".

Лесли Вэлианту 61 год, он родом из Великобритании, где он закончил Имперский колледж в Лондоне и Уорикский университет, преподавал, а в начале 1980-х перебрался в Гарвард. Здесь в 1984 году им и был написан труд «Теория обучающегося» – «A Theory of the Learnable», который до сих пор цитируют все теоретики и практики прикладного программирования обучаемых систем.

Собственно, главным достижением Вэлианта
стала теория приближенно правильного обучения
– Probably Approximately Correct Learning (PAC-learning),
в информатике известная просто как теория Вэлианта.

Теория представляет собой математический анализ самообучающихся алгоритмов, учитывающий, что очень важно, их вычислительную сложность: то есть объем работ, который требуется для решения задачи и получения машиной вероятно наиболее истинной гипотезы[b] за эффективное время, используя приемлемый (или даже жестко заданный) объем вычислительных ресурсов. Отработав достаточное число учебных итераций, машина может научиться «[b]предсказывать будущее», находя гипотезы, удовлетворяющие учебным данным.

Машина, таким образом, может сама, без подсказок,
научиться угадывать правильный ответ – таковым, к примеру, может стать «улыбка» в серии «не улыбок», которую должна уловить цифровая «мыльница» (данная опция, знакомая многим обладателям данного устройства, тоже выросла из вэлиантовской «теории обучающегося»).

Важным условием теории Вэлианта является именно эффективность.

Естественно, модели машинного обучения
создавались и до этого, но уровень их накопительной сложности
всегда провоцировал различные тупиковые рекурсии в алгоритмах обучения, когда определение правильной гипотезы оказывалось невозможным без подсказки, а также экспоненциальный рост вычислительных ресурсов уже на ранних стадиях обучения.

Так что эти модели оставались довольно примитивными, неавтономными (машинам требовались шпаргалки), медленными, а качество обучения – низким... ...

AiBollid
03-12-2011, 06:46 PM
12-MAR-2011_61.. ( http://gazeta.ru/science/2011/03/11_a_3551557.shtml )
11-MAR-2001_B... .... Лауреатом премии Тьюринга...

Вэлиант, использовав свои предыдущие математические наработки
в теории сложности перечислений и алгебраических вычислений
(в частности, им был предложен способ
по надежному выделению класса функций,
вычисляемых наиболее эффективно), разрешил это затруднение.

Начиная с середины 1980-х в программировании обучаемых систем началась настоящая революция, поскольку были найдены инструменты, позволяющие искусственному интеллекту снижать свой уровень энтропии, полагаясь, так сказать, на собственные силы, а не внешние каналы упорядоченных данных (подсказки, сравнительные таблицы, рутинный перебор сценариев, и т. д.).

Проще говоря, компьютеры в большей мере стали «думать по-человечески».

Практическим выходом теории Вэлианта
стал целый кластер программного обеспечения, имитирующего работу интеллекта – от хорошо знакомых всем программ распознавания речи, работающих в реальном времени,
до
эффективных интеллектуальных алгоритмов, находящих наиболее релевантную информацию по запросу,
а
также до эффективных интеллектуальных алгоритмов, находящих наиболее релевантную информацию по запросу,
а также эвристических спамовых фильтров, умеющих отличать «правильные» письма от «неправильных».

PS: Среди других достижений Вэлианта, отмеченных премией ,
его труды о параллельных и распределённых вычислениях.

AiBollid
03-12-2011, 07:10 PM
REF TO:
12-MAR-2011_61.. .. Лауреатом премии Тьюринга..

FROM AiBOLLID:

Странно, что ии-пацаны и не знали про такие прорывы в Гарварде.. а всё американское распознавание речи до сих пор базируется на Hidden Markov Model (HMM) for American English (VC++ версия из британского Кембриджа), умершего от зверства питерских большевиков в 1921 Андрея
Маркова..

А ии-спамовые фильтры - легко и успешно реализуются на CMU'ушных
Domain Rules Engine (ART/CLIPS.. .. JRules)..

То что Доктора выдвинули IBM и Гугл - внушает оптимизм
- остальные компании получили 2-5 лет форы в проектах обработки
Естественно-Языковых запросов и Беглом понимании устной речи в реальных условиях шума (Natural Speech Understanding in the Battlefield-Noise' Environment)

PS: Давненько я не встречал столь заказной заметки,
с таким корявым переводом см в тексте "Learnable"
«A Theory of the Learnable»

AiBollid
03-14-2011, 09:55 PM
14-MAR-2011_66.. ( http://habrahabr.ru/company/abbyy/blog/115226/ )
14-MAR-2011_A1 Ответы ген директора ABBYY на вопросы читателей Хабра

Сергей Андреев ( -A- ) ------ Уважаемые читатели и писатели Хабра!
Хочу сказать спасибо всем участникам этого обсуждения за их искреннее желание сделать нашу страну лучше. Это видно во всех вопросах, заданных здесь, даже если они порой звучат жёстко и предубеждённо. Я посчитал важным ответить на вопросы, потому что ABBYY слишком давно не рассказывала о том, чем мы занимаемся, и как мы это делаем. А отсутствие информации порождает много нелепых догадок. Итак, время отвечать на вопросы.

В этих ответах я буду иногда отвлекаться к общим суждениям и общей информации, но не для того, чтобы что-то рекламировать, а чтобы лучше объяснить причины, лежащие в основе наших действий.

Начну с того, что компании ABBYY уже 21 год. Все это время мы делаем интересные продукты и технологии, известные во всём мире. Сейчас это продукты распознавания печатного и рукописного текста и словари. В будущем – это продукты, основанные на компьютерной лингвистике. Наши интересы не лежат в области потребления. Наши руководители и акционеры не ездят на роскошных автомобилях, не покупают яхт, вертолетов и дворцов, у нас нет дач на Рублевке. Нам интересно делать новые удивительные продукты, а не ходить по магазинам.

Более 70% наших доходов зарабатывается не в России. По разным оценкам, от 30% до 50% сканеров и МФУ всего мира комплектуется российским программным продуктом ABBYY FineReader. Мы довольно хорошо диверсифицированы по источникам доходов. У нас нет зависимости от российского рынка и, тем более, от его госсектора.

Мы занимаемся только тем, что нам интересно. Только тем, на что мы готовы тратить время своей жизни. Нам не интересны распилы, политика, коррупционные схемы и прочая мутная деятельность.

Мы живем в России, работаем в России, платим все налоги. Как-то даже получили грамоту от налоговой инспекции, как лучший налогоплательщик района :) (не знаю радоваться этому или тревожиться). Наши дети здесь учатся, и никто не собирается никуда уезжать. Всё, что у нас есть, находится здесь! Нам не всё равно, что будет с Россией. И мы готовы участвовать в полезных для страны делах. Мы тратим свое время и средства на развитие образования и на другие полезные инициативы, которые развивают отрасль ИТ в России.

Может все это и покажется кому-то слишком возвышенным, но у нас тут и правда заповедник хороших людей с хорошими и общими интересами... ...

AiBollid
03-14-2011, 10:15 PM
14-MAR-2011_A2 Ответы ген дир ABBYY на вопросы читателей Хабра...
-X- Теперь давайте переключимся на вопросы по существу. Вопросов было много, много и ответов, поэтому сегодня здесь появятся пока только первый блок. В нём я отвечу на вопросы о технологии ABBYY Compreno, под которую ABBYY получила грант. Следующие блоки будут опубликованы в начале следующей недели..

-A- "… Деньги выделяются для создания технологии автоматической обработки текстов Compreno… Технология Compreno предназначена для создания систем анализа, перевода и поиска текстов на различных языках. С помощью данной технологии можно будет, например, осуществлять автоматическое составление базы данных контекста для улучшенного анализа текстов, автореферирование текстов и др..."

-Q1- Хотелось бы услышать больше конретики, с объяснениями на примерах. Я догадываюсь, что технология Compreno может использоваться при компьютерном переводе текстов, например для правильного определения структуры предложения на исходном языке – то есть для определения связей и отношений между словами в предложении на исходном языке.

Таким образом, генерация предложения на конечный язык будет проводиться с учетом всей структуры исходного предложения.

Насколько я вижу, в современных автопереводчиках такой анализ находится в зачаточном состоянии, примерно на уровне определения существительного (местоимения) и глагола к нему. Поэтому предложения современных переводчиков достаточно корявые...

-Q2- Насколько повысится качество перевода? Не получится ли так, что предложения будут генерироваться лингвистически связанными, со словами с правильными окончаниями, то есть на уровне структуры – никаких претензий не будет. Но на уровне смысла автопереводчик как генерировал белиберду, так и будет продолжать генерировать псевдоосмысленный текст?

-A1+A2- Отвечая на первые два вопроса, я хотел бы рассказать поподробнее про технологию ABBYY Compreno.

Хотя мы очень внимательно следим за разработками в этой области в мире, нам не известны аналоги созданной нами лингвистической технологии нового поколения ABBYY Compreno.

Центральным ядром создаваемой технологии служит универсальная иерархия понятий и модель отношений между этими понятиями (для специалистов: иерархия универсальных семантических значений и отношений между ними). Хотя все люди на земле говорят разными словами, но используют они очень похожую систему понятий.

Люди в разных странах ходят на работу, сидят дома, работают на компьютерах, составляют договоры, летают на самолётах, ведут переговоры. Для них строятся похожие бизнес-центры. Они находятся в похожих помещениях и пользуются похожей мебелью.

Все эти понятия и их взаимоотношения в разных развитых цивилизациях имеют гораздо больше общего, чем различного.

В дальнейшем это семантическое дерево понятий я буду назвать английской аббревиатурой USH (Universal Sematic Hierarchy) .

USH – это дерево понятий, универсальное для всех языков, толстые ветви которого являются более общими и универсальными понятиями (например, «путешествие»), а тонкие – более специфическими, но тоже универсальными понятиями (например, «командировка»).

Древесная структура позволяет обеспечить наследование свойств от предков к потомкам, благодаря которому описание новых понятий происходит быстрее, так как, чтобы описать понятие «приказ», уже не надо перечислять все характеристики понятия «документ».

Слова конкретного языка являются листочками на дереве USH.

Мы получаем возможность снимать неоднозначности. Например, в русском языке разные значения слова «управление» соответствуют понятиям на разных ветвях этого дерева, поскольку есть значение «управление» как департамент, а есть значение «управление» как действие.

Семантическое описание какого-либо конкретного языка превращается в прикрепление «листочков» – слов этого языка – к веткам USH.

Второй, но не менее важной частью технологии является
полный синтаксический разбор текста.

Синтаксис – это способ «кодирования» смысла
(для специалистов: семантических отношений) в конкретном языке.

Сами семантические отношения универсальны,
а способы их реализации в каждом языке – свои.

В каких-то языках установлен линейный порядок,
в других используются падежи, предлоги, специальные служебные слова, где-то используется всё сразу.

Для каждого языка синтаксическое описание делается заново,
но сами средства,
которые разные языки используют для кодирования смысла, перечислимы.

При описывании нового языка используется разные элементы конструктора (тот же линейный порядок, различные типы синтаксических преобразований, грамматические значения, предлоги, специальные конструкции).

Технология Compreno также успешно определяет
и более сложные синтаксические связи,
такие как замена слова «мальчик» на слово «он» в предложении (для специалистов: анафора): «Хоть мальчик и хотел поиграть, но он понимал, что у него мало времени».

Или целые пропуски в сложносочиненных предложениях
(для специалистов: эллипсис), например «он любит красное вино, а она – белое».

Выделяемые системой связи между понятиями
также выражаются в древесной структуре, фактически передают смысл написанного,
и несут важную информацию для поиска или перевода.

Таким образом, система стремится к определению смысла текста, написанного на обычном языке, позволяя машине «понять» этот текст
и трансформировать его в универсальное представление, не зависящее от языка.

Используя USH, синтаксическое описание языка,
а также статистику взаимоотношений между словами,
технология Compreno производит полный анализ текста
и при переводе его на другой язык использует слова, соответствующие правильным ветвям дерева USH и отношениям, выявленным при разборе исходного предложения.

Как вы понимаете, если для перевода нам удалось приблизить
компьютер к пониманию смысла текста, то это понимание можно использовать не только для задач перевода, но и для многих других чрезвычайно востребованных приложений.

Получение универсального представления (смысла)
дает возможность подойти вплотную к более качественному распознаванию речи, умному поиску информации, когда в качестве запроса используется естественный язык, а в качестве ответа можно получить документ, совсем не обязательно содержащий слова запроса, но зато содержащий их аналоги и правильные отношения между понятиями. Можно определять авторство документа, можно сделать реферат (выжимку из большого документа).

Можно ещё много чего сделать, когда у тебя есть
универсальная базовая лингвистическая технология ABBYY Compreno... ...

AiBollid
03-14-2011, 10:25 PM
14-MAR-2011_A3 Ответы ген дир ABBYY на вопросы читателей Хабра...

-Q3- Какие проблемы решает продукт, на который выделены деньги в Сколково? Каковы области его применения? Какие новые возможности он предоставит обычным людям?

-Q4- Перечислите конкретно, в каких типах программ вы сейчас видите необходимым использовать Compreno, если бы вдруг сейчас она уже была бы полностью готова?

-A3+A4- Технология Compreno
– это универсальная лингвистическая платформа для приложений, решающих множество прикладных задач по обработке текстов на естественном языке, таких как:

1. Письменный и устный перевод с одного языка на другой;

2. Интеллектуальный поиск, в частности:

* Поиск по смыслу, а не по ключевым словам;

* Извлечение фактов и связей между объектами поиска (в т.ч. для конкурентной разведки);

* Мониторинг компаний и персоналий и построение аналитических отчетов на основе параметров разного типа. Например, при подготовке отчета на тему «Какой тариф сотовых операторов является самым популярным?» важно не только верно идентифицировать все тарифы, обсуждаемые в СМИ, но и сравнить частотность.

* Возможность получить ответы на запросы, заданные обычным языком (например, «Чем владеет Иван Иванович Бобров?»).

3. Многоязычный поиск, т.е. когда на вопрос на одном языке находятся ответы на всех языках, поддерживаемых системой;

4. Классификация и фильтрация документов;

5. Защита от несанкционированного использования информации;

6. Автоматическое реферирование и аннотирование документов;

7. Распознавание речи..

В мире сейчас не существует настолько универсальной технологии, позволяющей решить так много прикладных задач, требующих качественного лингвистического анализа текстов.

И речь идет не только о традиционных задачах, таких как перевод, но и задачах, решение которых на качественно новом уровне было невозможно в прошлом (например, автоматический поиск фактов и связей в массивах информации).

Революционность ABBYY Compreno состоит в фундаментальности подхода.

Над универсальной системой понятий и технологиями полного синтаксического и семантического анализа задумывались многие.

В своей работе мы опираемся на труды ведущих российских учёных в этой области и классическое лингвистическое образование.

Однако многие специалисты отступали перед колоссальной инженерной и лингвистической сложностью реализации этой идеи для реальных практических задач.

Передовое российское лингвистическое образование и наука дали нам очень хороший фундамент для начала и развития этой большой работы...

AiBollid
03-14-2011, 10:40 PM
14-MAR-2011_A4 Ответы ген дир ABBYY на вопросы читателей Хабра...

-Q5- На что пойдут деньги? Какие ожидаются результаты? Будет ли результат новым продуктом, или он разойдется по старым?

-Q6- Проект разрабатывается уже около 10 лет. О каких-либо публичных результатах я не знаю. Не превратился ли он в долгострой с неясными перспективами? Каковы гарантии, что этот грант будет последним необходимым для выхода продукта?

-Q7- На какое время рассчитан проект, который будет реализовываться в Сколково?

-A5+A6+A7- Отвечаю на три вопроса!

В психологии известно, что ребёнка от взрослого отличает неспособность контролировать свои импульсы – и это одна из причин, почему он никогда не сможет заменить взрослого во многих видах взрослой деятельности. Так же и зрелую компанию, построенную надолго, от фирмы-однодневки отличает способность вкладываться в проекты, которые принесут плоды через годы. Читайте подробнее здесь.

Добавлю, что мы уже давно решили, что заниматься нужно только тем, в чём ты уверен, что можешь добиться самых лучших результатов в мире. Если же у тебя нет разумных оснований полагать, что ты станешь в своем деле самым лучшим в мире, то это плохой бизнес, потому что он будет сведен в итоге к ценовой конкуренции. Уникальные вещи быстро не делаются, иначе их было бы легко повторить.

Ну а теперь по сути того, чем мы занимаемся.

Работа над созданием технологии Compreno ведется уже 15 лет (на людей, которые занимаются этим и другими нашими проектами вы можете посмотреть здесь).

Дело в том, что этот проект требует серьезного научного фундамента, без которого невозможно создать работающую технологию действительно высокого качества. Фундаментальная наука, как известно, требует денег и времени.

15 лет назад началось продумывание основных концепций новой технологии.

Примерно 10 лет назад – работы по построению архитектуры, около 6 лет назад – серьезные работы по программированию базовых модулей,

а около 2 лет назад были пройдены самые серьезные технологические риски.

Проект вошел в ту фазу, которая позволяет нам с высокой степенью уверенности говорить о достижимости поставленных целей.

Результат, к которому мы стремимся, я описал в одном из предыдущих ответов.

Мы ожидаем, что коммерческие продукты для широкого применения на базе платформы Compreno появятся в течение 2-3-х лет.

Но уже сегодня мы демонстрируем технологию Compreno крупным заказчикам, Специалисты, которые видят, как работает технология уже сегодня, обсуждают с нами пилотные проекты.

Кроме того, мы готовим еще один наш продукт – библиотеку функций, доступную для других разработчиков приложений. То есть любой разработчик сможет лицензировать ядро системы и встроить эти функции в свои программные продукты.

В конце, чтобы снять сомнения в перспективности «долгостроя»,
хочу добавить, что все эти годы акционеры компании (примерно совпадающие с ее менеджментом) вместо обогащения и покупок яхт, вилл и прочего хлама вкладывают прибыль компании в совершенно новое прорывное направление.

Мы смогли построить качественный наукоемкий международный бизнес,
и считаем себя компетентными в том, чем мы занимаемся. Кому как не нам лучше знать, куда вкладывать свои деньги? Разве кто-то кроме нас может более надежно оценить правильность этого вложения? Если кто-то считает, что мы ошибаемся, и знает, как можно применить наши деньги лучше, – то могу поздравить нас всех с появлением новых бизнесменов, которые прославят нашу родину своими делами. Дорогу молодым! Ждем постов о ваших успехах!...

AiBollid
03-14-2011, 10:48 PM
14-MAR-2011_A6 Ответы ген дир ABBYY на вопросы читателей Хабра...

-Q8- Хотелось бы больше узнать о системе распознавания, а именно.
Будет ли она «языконезависимой» или будет в том числе опираться
на морфологию каждого языка, как и нынешняя система в FineReader'е?

Во втором случае, планируется ли использовать открытый формат
или технологию позволяющую добавлять правила морфологии для новых языков самим пользователям? (Скажем по примеру hunspell/aspell словарей в браузерах).

-A8- Я надеюсь, что предыдущие ответы прояснили эту тему.
Если нет, уточните, пожалуйста!

-Q9- Какой профит государству и гражданам от этой технологии?
Мне интересно ее применение в чем-то кроме ваших продуктов.

-A9- Немногие знают,
что продажа библиотек функций ABBYY FineReader для разработчиков приносит нам больше доходов, чем продажа коробок ABBYY FineReader.

Мы также планируем сделать технологию ABBYY Compreno
доступной для других разработчиков, чтоб ее можно было включать в другие продукты, требующие качественной обработки текста на естественном языке.

Это подстегнёт развитие самых разных российских бизнесов, использующих Compreno для создания программ или оказания услуг.
Мы полагаем, что часть этих высокотехнологичных продуктов или услуг будет продаваться за рубеж, что в текущей ситуации преимущественно нефтегазового российского экспорта не может не радовать.

Кроме того, не надо забывать,
что создание такой технологии здесь, в России, повышает общий уровень квалификации в данной области в стране. Потому что люди, которые так хорошо понимают в прикладной лингвистике, живут, работают, платят налоги и тратят свои деньги в России, а не в Калифорнии, Мюнхене, Калькутте или Гуаньджоу.

Конференции, лекции и семинары, которые проводит ABBYY на тему искусственного интеллекта и прикладной лингвистики, проводятся в России. ABBYY поддерживает образование в этой области в наших вузах, а не в MIT или Пекинском университете. И вообще, шанс получить мировое лидерство в этой локальной области знаний есть именно у России, а не у Америки, Израиля или Индии.

Немедленный ПРОФИТ со всего этого государству и гражданам
посчитать сложновато, но вот ПОЛЬЗА очень большая,
особенно если смотреть на долгий временной горизонт...

AiBollid
03-14-2011, 11:05 PM
14-MAR-11_A7 Ответы ген дир ABBYY на вопросы читателей Хабра...

-Q10- Какие технологии искусственного интеллекта используются в работе?

-A10- Для построения
языконезависимой семантической структуры
используются технологии синтаксического и семантического анализа.

Для разрешения омонимии
используются технологии классификации и машинного обучения.

-Q11- Сколько будут стоить ваши новые технологии?

-A11- Постараемся сделать так, чтобы от их применения выиграли все.

Чтобы переводчики
могли больше зарабатывать, повысив производительность труда,
чтобы заказчик мог перевести больше, а заплатить меньше.

Иначе не получается делать бизнес в современном мире.

Ты будешь успешен, только если все твои партнеры и клиенты будут успешны. Наверняка что-то будет доступно бесплатно в интернете!

-Q12- Можно ли (и будете ли?) использовать технологию Compreno
для улучшения качества распознавания текстов?

Имеется в виду,
поможет ли Compreno принимать решение в спорных случаях при дефектах на распознаваемой картинке?

Может ли Compreno
работать с неполным набором данных
и помогать делать предположения о том,
что должно находиться на плохо читаемом месте?

-A12- Видимо какие-то элементы технологии Compreno
будут использованы в системе распознавания FineReader в будущем.

-Q13- Как может ваша система помочь мне, простому строителю?

-A -Отличный вопрос!
Вы сможете сфотографировать на свой мобильный телефон мешок с сухим китайским клеем или банку с немецкой краской, нажать на кнопку «Перевод», программа распознает и переведёт китайскую и немецкую инструкции на русский язык, что поможет Вам правильно развести клей или смешать краски.

Вы сделаете Вашу работу качественно,
и она принесет радость тем людям, которые будeт жить в построенном Вами доме. Это мы и называем «помогать людям лучше понимать друг друга». Мы создаем технологии искусственного интеллекта, которые повышают качество жизни. В этом смысле мы с Вами коллеги. Вы также создаете то, что повышает качество жизни

AiBollid
03-14-2011, 11:34 PM
Ответы генерального директора ABBYY Сергея Андреева
на вопросы читателей Хабра. Часть 2. Грант

AiBollid
03-14-2011, 11:36 PM
15-MAR-2011_77.. ( http://habrahabr.ru/company/abbyy/blog/115423/ )
14-MAR-2011_Г1.. Ответы ген дир ABBYY на вопросы читателей Хабра:

-A- Уважаемые читатели и писатели Хабра! Перед ответами на вопросы о гранте я решил опять сделать вступление, чтобы опереться на очень важный фундамент.

Давайте разберемся с целями государства в области IT сектора экономики. Думаю, что правильная цель звучит примерно так: IT сектор рассматривается как один из 5 чрезвычайно важных секторов экономики, требующих ускоренного и даже опережающего развития. Конкретной задачей на этом фоне является ускоренное создание новых и развитие существующих отечественных IT компаний, конкурентоспособных на мировом рынке.

Если это утверждение кто-то оспаривает, то лучше обратиться в Общественную палату и в Комиссию по модернизации при Президенте РФ, и спорить с ними. Аргументируйте, возражайте, предлагайте другие отрасли. Это точно не к нам и не для этой дискуссии.

Если согласие по вышеуказанному вопросу есть, то давайте обдумаем, а что собственно делать для ускоренного развития существующих и создания новых IT компаний? Чем поддержать? Чем стимулировать? Если сюда сейчас придут сторонники свободного рынка, которые скажут, что нет ничего лучше рынка для развития конкурентоспособных IT компаний, то я, извините, не соглашусь. Потому что свободный рынок сегодня имеет существенную особенность. Он открыт для гигантских международных компаний, которые в сотню раз больше самых успешных российских IT компаний. Свободная конкуренция между слоном и мышью – это лукавство. А, точнее говоря, это борьба за сохранение текущего статуса кво. Кто-то хочет за это бороться?

Итого – для поддержки и стимулирования нужны нерыночные меры и преференции. А значит, предстоят расходы из бюджета или внебюджетных фондов. Поэтому ПО ЛЮБОМУ расходы будут, и кто-то получит какие-то средства от государства. Если кто-то не может с этим жить, и требует исключительно рыночной «поддержки» без расходов из бюджета, то ему надо найти мир с самим собой. Ибо не бывает поддержки без расходов. Поэтому – либо поддержка и стимулирование (с расходами), либо рынок.

Также совершенно понятно, что при условии правильного выбора адресата поддержки, чем более большими и «нерыночными» будут меры поддержки, тем более существенным будет результат. Дадите чуть-чуть – тоже хорошо. Где-то кому-то станет чуть-чуть лучше. Дадите больше – разумно ожидать большей отдачи. Мы не забываем ни на минуту про цели мероприятия – создание нового или развитие существующего IT бизнеса. То есть, выбирая меры поддержки, мы, конечно, должны тщательно анализировать, куда идут средства, как используются, на что и где расходуются, какие перспективы отдачи от такой поддержки.

То есть на самом деле ключевым вопросом является не степень нерыночности, а правильный выбор объектов стимулирования и набор разумных условий, накладываемых на объект стимулирования.

Если вы считаете, что среди 10 компаний, уже получивших гранты в Сколково, есть недостойные, — тогда аргументируйте и предлагайте экспертам Сколково более достойных.

Если же на самом деле кто-то не хотел никого стимулировать, тогда зачем сейчас обсуждать конкретный грант конкретной компании – надо обсуждать нецелесообразность нерыночных мер в принципе. Их много, и размеры их существенно превышают 475 млн. руб. Нецелесообразно хвататься за столь мелкую мишень. Вспомните про нерыночные цены на газ внутри страны, вспомните про целевые дотации из бюджета и резервных фондов тонущим предприятиям, происходившие в 2009 году. Чего же из пушки по воробьям? Гулять, так гулять! А вот если гулять не хочется, тогда не стоит общественность будоражить. Смысла не видно...

AiBollid
03-14-2011, 11:49 PM
15-MAR-2011_77.. ( http://habrahabr.ru/company/abbyy/blog/115423/ )
14-MAR-2011_Г2.. Ответы ген дир ABBYY на вопросы читателей Хабра:

-A- Вот, собственно, таков и есть фундамент, на котором строятся решения вокруг этого гранта:

1. Требуется поддержка отечественной IT индустрии.

2. Поддержкой являются только нерыночные действия, то есть сопряженные с расходами (или недополученным доходом) налогоплательщиков.

3. При нормальном контроле и разумных критериях отбора — чем больше потратим, тем больше поддержка, тем больше результат.

4. Доверяем выбору Сколково по списку предоставленных грантов, либо предлагаем своих более достойных.

Дальше будут ответы на более детальные вопросы, которые, надеюсь, снимут оставшиеся неясности по поводу гранта. Это не последний блок ответов на вопросы. В ближайшее время опубликую оставшуюся часть...

-Q14- Каким образом компания добилась выделения денежных средств?

-A14- Мы подали заявку в проект Сколково.
Эксперты оценили эту заявку и решили, что она
достойна софинансирования со стороны фонда Сколково.
Я полагаю, что наша заявка была признана соответствующей целям и задачам Сколково, потому что результатом работ, которые проведет компания «Аби Инфопоиск» должны стать технологии и продукты, не имеющие мировых аналогов и способные создать очень большой и качественный бизнес, успешный на международной арене.

Важным анализируемым фактором является готовность бизнеса соинвестировать в этот проект суммы, не меньшие, чем инвестирует фонд Сколково. Этот фактор присутствует и сильно снижает риск фонда потратить деньги впустую.

Еще одним важным фактором является оценка потенциала коммерциализации. Здесь очевидно был принят во внимание опыт ABBYY по продаже наукоемкой продукции на мировых рынках.

Важно то, что интеллектуальная собственность, возникающая в этом проекте, будет принадлежать российской компании – резиденту Сколково.

Значит, и прибыль будет также оседать в этой компании.
Деньги фонда и деньги компании-соинвестора (ABBYY) будут потрачены в России, прежде всего, на оплату труда наших отечественных специалистов...

AiBollid
03-15-2011, 12:15 AM
14-MAR-2011_Г3 Ответы ген дир ABBYY на вопросы читателей Хабра:

-Q15- А вот бету надо бы показать, а то у многих спецов есть сомнения.

Но теперь ситуация полностью изменилась.
Акционерами стали все наши налогоплательщики, и, следовательно, все общество.

По этой причине Вы обязаны публично:

1. Продемонстрировать вашу бету. Или дать подробный отчет о тестах.

2. Выкатить разумный план-график со сроками, майл-стоунами и т.д.

3. Выпускать отчеты о потраченных средствах

-A15- Сомнения объяснимы. Задача, на которую мы замахнулись, пока никем в мире не решена. Технологических рисков и проблем на всех этапах разработки очень много. Но спецы, которым мы это показываем, при стартовом скепсисе остаются удовлетворены уровнем развития технологии и одобрительно говорят: «Верной дорогой идете, товарищи».

Акционерами ABBYY наши налогоплательщики не стали. Это преувеличение. Многие данные из запрашиваемых Вами для публикации пока конфиденциальны. Мир состоит не только из добрых людей, и не все желают нам успеха. Даже акционерам мы не обязаны демонстрировать бета-версии и давать подробные отчеты о тестах, если у них мало акций. План-график с майлстоунами, конечно, есть, и его «выкатили» в договор о финансировании. Поэтому, люди, своей головой, а не репутацией на Хабре отвечающие за деньги, его видели и контролируют.

Регулярные отчеты и аудит в договоре есть. Чтобы сделать позицию по проекту более открытой, мы можем предложить небольшой расчет.

Любой бизнес платит налоги, которые идут в бюджет государства. И хотя Сколково дает существенные льготы по налогам, давайте оценим, сколько же денег вернется государству от проекта.

Расходы проекта складываются, в основном, из зарплаты и прямых закупок (аренда помещений, связь и компьютерная техника). Зарплата — это самый большой расход, существенно больше половины всех расходов. С фондом заработной платы связаны два налога — взносы в социальные фонды (ставка Сколково — 14% с первых 463 тыс. руб. зарплаты на каждого сотрудника) и подоходный налог (13%). Все хозяйственные расходы компании содержат в цене НДС по ставке 18%, который для резидента Сколково не может быть возмещен, т.е. в полном размере уплачивается в бюджет. Также сотрудники компании, тратя свою зарплату, тоже уплачивают НДС на большинстве своих покупок.

Нижеприведенные цифры примерно соответствуют нашим планам по данному проекту.

Количество сотрудников — около 250.
Зарплата на руки для большей части сотрудников — от 50 тыс. руб. до 80 тыс. руб. в месяц.
ФОТ — 221 млн. руб. в год (включая НДФЛ).

Бюджет проекта на три года складывается из 475 млн. руб. от фонда и 475 млн. руб. от ABBYY. То есть в год расходный бюджет составит 317 млн. руб. Суммарные налоги от проекта составят примерно 86 млн. руб. в год:

* 16.2 млн. – взносы в пенсионный и прочие фонды,
* 28.8 млн. – НДФЛ,
* 12.1 млн. – НДС на закупленные компанией услуги (аренда, оборудование и т.п.)
* 29.4 млн. – НДС, оставляемый российскими сотрудниками в российских магазинах от 192 млн., выплаченных им на руки.

Эта сумма будет расти с годами прямо пропорционально росту бизнеса (мы оцениваем по минимуму и роста бизнеса в расчете не учитываем).

Суммарные инвестиции государства в проект – 475 млн. руб. Эта сумма почти полностью вернется в бюджет за 5 лет только за счет налоговых поступлений. С 6 года и далее компания будет приносить чистую прибыль бюджету.

Насколько выгодно такое вложение с финансово-инвестиционной точки зрения? Чистый возврат средств для государства составляет около 20% в год. При этом работающий бизнес, по сути, гарантирует защиту от инфляционного сжимания базы инвестиций. Получается, что государство приобрело инструмент с прибыльностью 20% и защитой от инфляции. Для сравнения, денежные бонды с защитой от инфляции дают 3-4% годовых. Для частных прямых инвестиций доход портфеля, превышающий 10-15%+инфляция, – это большая удача.

Таким образом, даже если полностью отвлечься от стратегических, социальных и прочих выгод развития высокоинтеллектуального бизнеса в России, грант успешному предприятию в режиме 50 на 50 с частным инвестором – это очень выгодное вложение средств для государства.

AiBollid
03-15-2011, 12:27 AM
14-MAR-2011_Г4: Ответы ген дир ABBYY на вопросы читателей Хабра:

-Q16- Станет ли
разрабатываемый на деньги государства/налогоплательщиков проект общественным достоянием?

Имеет ли государство право
пользоваться вашими наработками (новыми) после получения вами гранта? - Будут ли доступны налогоплательщикам исходные коды?

-A16- Хочу напомнить финансовую предысторию проекта.
Мы уже вложили в него более 1000 человеко-лет,
которые оцениваем примерно в 50 миллионов долларов.

Мы собираемся вложить
еще около 16 миллионов долларов (474996000 руб.),
и фонд Сколково вложит еще около 16 миллионов долларов (474996000 руб.).

То есть пропорция получается примерно 66 к 16.
В таких условиях говорить о бесплатных раздачах всего,
что мы делали, делаем и будем делать, кажется преждевременным.

-Q17- В предыдущем топике про Сколково
звучали обвинения в адрес ABBYY, что делаете закрытый продукт
на деньги с налогов (это про этот грант), как вы можете прокомментировать эти высказывания?

-A17- Известно, что развитые государства стремятся субсидировать те стратегические отрасли бизнеса, которые приносят долговременное общественное благо. Например, способствуют повышению конкурентоспособности страны, улучшению экологии, повышению занятости населения и т.д. Например, английское правительство через Carbon Trust www.carbontrust.co.uk/Pages/Default.aspx безвозмездно перечисляет внушительные суммы компаниям, развивающим в стране возобновляемую энергию (солнечную, ветряную). Европейский союз через проект CORDIS cordis.europa.eu/home_en.html распределяет безвозмездные гранты компаниям, разрабатывающим технологии в ключевых областях, и так далее.

ftp.cordis.europa.eu/pub/fp7/docs/financialguide_en.pdf, стр. 71. Тут написано, в каком объёме производится финансирование. На исследование и разработки выделяют не более 50% или 75%. 75% получают неприбыльные организации, SME, университеты, исследователи. Коммерческие компании получают 50%.

cordis.europa.eu/documents/documentlibrary/91594641EN6.pdf Этот документ полностью посвящен описанию использования прав на полученные исследования. Основной принцип написан в 4.1 на стр.7. В нём сказано, что права принадлежат тем, кто создал результат. Выдавать вне проекта кому-либо что-либо не обязательно. Внутри проекта права должны быть выданы в соответствии с правилами ведения проекта, чтобы проект был исполнен.

Цель Сколково – повышение глобальной конкурентоспособности России в области высоких технологий. Для достижения этой цели используются различные способы поддержки, в том числе и выделяются гранты, которые подстегнут создание технологий, выводящих Россию вперед на мировом IT-рынке. Бесконечно зависеть от цены на нефть нельзя.

Во вступлении к этому посту я постарался предельно ясно сформулировать дилемму. Она в том, что, либо мы поддерживаем правильно выбранные проекты, либо не поддерживаем. Уже понятно, что среди читателей есть люди, стремящиеся к более сдержанной поддержке. Ну, например, к инвестиционным деньгам. Но решали не они, и решение было принято другое.

Является ли это решение поддержкой? – Да.
Оно полезно получателям? – Да.
Оно ведет к решению поставленной экономической цели страны? – Да.

Если подумать, есть ли разница между грантом и инвестицией в бизнес, который не пришел к успеху, а разорился, то понятно, что разницы нет. Деньги потрачены, и вернуть их невозможно и в случае гранта, и в случае инвестиции. Есть ли разница между грантом и инвестицией, если бизнес успешен? Есть. При инвестиции можно вернуть деньги, продав акции. Однако здесь важен не сам факт, вернешь ты эти деньги или нет, а другое – успешность бизнеса. Поэтому, если уж он успешен, то, как показал расчет выше, даже по самым консервативным оценкам деньги вернутся государству очень быстро. А рискованный изначально, но успешный бизнес получит премию в виде гранта. Но с другой стороны, решать, конечно, государству...

AiBollid
03-15-2011, 12:38 AM
14-MAR-2011_Г5: Ответы ген дир ABBYY на вопросы читателей Хабра:

-Q18- Почему эти деньги выгоднее вкладывать в ABBYY,
а не, например, в гранты для научных проектов студентов?

Не выгоднее ли вложить этот грант в разработку чего-то с нуля,
сделать продукт, продавать, часть средств вкладывать в развитие старого, другую же часть вкладывать в новое?

-A18- В нашем случае на фоне упадка финансирования науки в стране это знамя (науку) подхватывает коммерческая компания, которая ведет фундаментальные прорывные исследования с высокими прикладными перспективами. В команде ABBYY в России работают аспиранты, доценты, 31 кандидат наук и 3 доктора наук! Тянет на целое подразделение НИИ! На этом фоне поддержка государством такого грандиозного почина не кажется странной. Государство заинтересовано в эффективной науке? Вот она! При этом государство обычно финансирует науку на 100% и совершенно не уверено в результате. А здесь бизнес уже профинансировал проект на 50 миллионов USD и профинансирует еще на 16. Государство же вложит $16 миллионов (474996000 руб.). Таким образом, вырисовывается пропорция 16 на 66 при высоком потенциале коммерциализации, чего очень трудно ожидать от обычных научных исследований. После этого трудно сказать, что это плохая модель развития науки. Воспроизвести ее, конечно, будет непросто. Не видно пока других подобных коммерческих проектов.

ABBYY с поддержкой Сколково не только создает рабочие места для умных людей (которые бы легко нашли работу за рубежом). Благодаря проекту Compreno в России повышается общий уровень знаний, компетенции в крайне перспективной области – прикладной лингвистике. А это подстегивает создание в России бизнесов, применяющих и развивающих эти технологии. В итоге это подталкивает российский экспорт интеллектуальных продуктов.

Выгоднее или невыгоднее вложить деньги в студенческие проекты, в разработку чего-то с нуля? Трудно сказать. Вы пробовали быть инвестором в высокотехнологические бизнесы? Инвестор хочет успеха. Кейсов со студентами и с проектами «с нуля», в которых вероятность успеха высока – до обидного мало. Основная проблема у фонда Сколково, на мой взгляд сегодня связана не с тем, что слишком много претендентов, а с тем, что слишком мало тех, кому деньги дать хочется. Проектов вроде много, но у каждого есть какие-то существенные слабые места. В нашем случае вероятность успеха высока.

Вы получаете финансирование (как значится в документах на i-gorod.ru) на этапе коммерциализации. Правильно ли я понимаю, что технология разработана, и деньги вы получаете для «упаковки» и продажи этой технологии?

Конечной целью, конечно, являются коммерчески успешные продукты. Но целью финансирования является разработка новых технологий и продуктов. Это точно не «упаковка» и продажа. Более того, компаниям-резидентам Сколково разрешена только научно-исследовательская деятельность, а не разворачивание комплекса маркетинга и продаж. Это ресечерская компания и грант выдается только на эти цели.

-Q19- Интересно, какую отчетность и как часто
придется предоставлять в Сколково? Есть ли какие-либо привязанные
к плану критерии успеха, по которым ABBYY придется отчитываться?

-A19-

1. На сегодняшний день мы не получали от фонда Сколково 475 млн. руб. Мы получили 79 млн. 166 тыс. руб.

2. Мы вложили свои 79 млн. 166 тыс. руб.

3. По истечении полугода мы должны предъявить список продуктов и/или их компонентов и технологий с конкретными измеримыми качествами.

4. В случае успешного прохождения контроля мы получим следующие 79 млн. 166 тыс. руб от фонда и добавим свои 79 млн. 166 тыс.

5. Каждые полгода происходит аналогичный контроль и принятие решения о целесообразности перечисления очередной порции финансирования.

6. Контролируется также на что и где были потрачены деньги.
7. По договору мы должны создать ряд продуктов в области перевода текстов и поисковых технологий. Если мы их создадим и представим, значит, деньги были потрачены целевым образом и привели к запланированному результату (готовые продукты или их модули).


Контроль над этим фондом колоссальный,
так как весь проект Сколково находится на контроле лично у Президента и очевидно очень важен с точки зрения ближайших перспектив.

-Q20- По сообщениям Сколково для ABBYY выделено
474996000 рублей. По вашим словам, сказанным журналисту Cnews, компания получила
450000000 рублей. Журналисты, как всегда, плохо расслышали,
не поняли, специально подгадили? Или вы ошиблись?
Или почти 25 млн рублей немножко испарились по ходу дела?

-A20- В интервью CNews цифры округлили. Поcкольку ABBYY ведет международный бизнес, и большую часть своих доходов мы получаем на международных рынках, у нас внутренняя учетная валюта – доллар. Курс доллара в последнее время быстро менялся и оценочные суждения не уследили за этой динамикой. Мы всегда оценивали это финансирование примерно в 15 миллионов долларов. Вот и ошиблись с округлениями на фоне быстро меняющегося курса. Объем финансирования проекта составляет 474 996 000 рублей. Эта информация есть и в официальных источниках Сколково: www.i-gorod.com/participants/ooo_abi_infopoisk/

-Q21- Пилить планируете или только честный труд? :D ???

-A21- Только честный труд. Коллеги, в этом проекте все на виду. Тут ни копейки нельзя потратить неправильно. Тут основные беспокойства должны быть связаны скорее с гиперконтролем, чем с коррупцией...

AiBollid
03-15-2011, 12:41 AM
14-MAR-2011_Г6: Ответы ген дир ABBYY на вопросы читателей Хабра:

-Q22- Считаете ли вы правильным и нормальным, что «материнская» компания
получателя государственного гранта зарегистрирована на Кипре?

Зачем нужна сложная и бессмысленная схема владения компанией ООО «Аби ИнфоПоиск» (сначала два других ООО, а потом — кипрский офшор)?

Как это сочетается
с принципами открытости бизнеса и честного ведения дел? ? ? ? ? ?

-A22- Очень достойный вопрос. Но на него есть не менее достойный ответ. Российские компании группы ABBYY всасывают доходы из-за рубежа, а не выводят российские доходы за рубеж. До 2010 года действовал налоговый спецрежим для компаний-экспортеров ПО.

Мы под него проходили и им пользовались.
Критерием применения спецрежима было, в том числе, не менее 70% экспортной выручки в общем объеме выручки.

Мы работаем насосом, закачивающим средства внутрь России.
Мы их здесь тратим на зарплаты умным людям, налоги, аренду, приобретаемые услуги и т.д. В этом наше главное отличие от международных компаний. Мы здесь живем.

Если компания занимается международным бизнесом, она должна строить международную структуру. Все международные компании имеют офисы в разных юрисдикциях, не нарушая законов…

Обычным требованием международных инвесторов
является легальный головной офис за пределами России.

У нас в миноритарных акционерах
с 2002 года есть иностранный венчурный фонд – Mint Capital.

Как еще можно было регистрировать новую компанию,
входящую в международную группу? Использовать в качестве учредителя непосредственно кипрскую компанию? Регистрация заняла бы примерно втрое большее времени.

Если не видеть везде негодяев,
то на все вопросы можно найти очень простые объяснения.

Согласно инвестиционному договору полученные деньги должны быть потрачены исключительно в России для целей разработки ПО.

Примерный бюджет приведен выше.
IP rights должны остаться в этой компании.
Говоря о налогах в России и о компании «Аби Инфопоиск»,
надо отметить, что налоговый режим в Сколково лучше,
чем на Кипре, Багамах, Каймановых островах и где бы то ни было еще.

Выводить прибыль
из Сколковской компании куда бы то ни было не имеет смысла.
Если же мы 10 лет будем делать успешный бизнес в Сколково,
то не остается причин для тревог. Все хорошо: прибыль в России, рабочие места – в России, IP rights – в Росссии.

А что будет после 10 лет, не знает никто.
Но скорее всего мир изменится, и оргструктура многих компаний, в том числе и компании ABBYY, изменится настолько сильно, что предполагать сегодня об этом что-либо совершенно невозможно.

Также было очень важно использовать
для резидентства в Сколково совершенно новую компанию.
Она прозрачна, ее гораздо легче контролировать и проверять.

-Q23- Если компания верит в Россию,
то наверное и патенты у нее зарегены на российскую контору, логично? Я поискал на uspto.gov и нашел вот это: www.uspto.gov/web/patents/patog/week41/OG/html/1359-2/US07813011-20101012.html «Assigned to ABBYY Software Ltd, Nicosia (Cyprus)».

Хм, та самая компания, зарегенная на Кипре. почему?

Да потому что только дурак
будет держать интеллектуальную собственность в России.

А ABBYY — не дураки. Но и не патриоты....

-A23- Патенты в области ПО важны только в Америке.
Именно там совершенно необычная легальная система, которая позволяет патентовать довольно очевидные вещи и агрессивно использовать эти патенты либо для троллинга успешного бизнеса, либо для атаки конкурента.

В Европе и России такие случаи очень трудно вспомнить. Поэтому фокус патентования для международного бизнеса по продаже ПО, конечно, сильно сдвинут в сторону получения патентов в США.

А есть ли какой-то особый смысл регистрировать американские патенты на российскую компанию? Обычно – нет. Ну и, кроме всего, прочего Mint Capital предпочитал «складирование» IP Rights в более привычной юрисдикции.

Тем не менее, есть два очень важных замечания к этому ответу.

* По договоренности со Сколково мы будем размещать все патенты и все права на продукты и технологии, связанные с проектом ABBYY Compreno в нашей Сколковской компании.

* Размещение американских патентов в зарубежной компании не отменяет ранее сказанного факта о том, что российские компании группы ABBYY вкачивают ресурсы в страну и тратят их здесь на разработку, а не наоборот. Сама по себе легальная структура ни о чем не говорит. Она решает много разных задач. Для рассмотрения факта российского происхождения критически важны направления финансовых потоков. А они подтверждаются публично нашим статусом экспортера и контролируются налоговой при применении ранее активного спецрежима.


А патриотизм, по-нашему, это не когда флагами машут, а, когда у тебя есть выбор из вариантов, среди которых есть полезный для страны, бесполезный и вредный, и ты выбираешь полезный.
В этом смысле, мы – патриоты. А выбор у нас есть, вы уж поверьте...

AiBollid
03-15-2011, 12:54 AM
14-MAR-2011_Г7: Ответы ген дир ABBYY на вопросы читателей Хабра:

-Q24- Кто-то только делает,
а кто-то уже сделал и ждал этого гранта
для наработки базы,
которую без него составлять ещё лет двадцать своими силами.
А уж такая компания могла бы и сама проектом заниматься со своими ресурсами, не отнимая их у тех кому они реально нужны.

У меня отчасти близкий проект, правда часть ваших проблем уже решена )

Подход на основе единого языка сущностей это отлично,
--- но лет через 5 - когда будет большая база до вас дойдет
что в нем кое-чего не хватает, на что я напоролся в свое время:

-A24- Вам этот грант вряд ли подходит.
Вы ведь, наверное, не готовы положить 16 млн. USD на стол.

А кроме всего прочего, может стоило подать свой проект в Сколково?
Может, то, чего Вы ждали так долго, лежит и ждет Вас?

AiBollid
03-15-2011, 01:05 AM
14-MAR-2011_Г8: Ответы ген дир ABBYY на вопросы читателей Хабра:

-Q25- Не стыдно ли вам брать деньги от жуликов и воров?

-A25- Мы видели в России чиновников, которые не берут деньги.
И если кто-то не может с этим жить, то ни мы, ни кто-либо еще не сможет ему помочь, потому что он живет в вымышленном и очень плохом мире.

А мы живем в другом мире, и в нашем мире можно получить такие деньги, использовать их для дела, не своровать, не откатить и добиться успеха, которым потом будет гордиться вся страна. В каком мире жить вам — выбирайте сами!

-Q26- Вам не стыдно брать деньги у государства, которое цинично держит в тюрьме своих критиков по надуманным обвинениям, пытками убивает финансового юриста, способствует воровству миллиардов рублей у западного инвестфонда? У государства, где только по официальным данным, озвученным президентом, сумма откатов от госзаказов составляет триллион рублей в год?

-A26- У вас есть паспорт гражданина России? Вы платите налоги в России? Если да, не считаете ли вы это компромиссом с совестью? Вы пробуете перевести эту дискуссию в политическую, но я этого не хочу. Мои оценки российского государства не столь полярны, как Ваши, и я считаю, что если мое государство делает что-то правильное и полезное, то сотрудничать с ним можно и нужно. Наша компания не могла бы возникнуть в США или в любой другой стране. Наша компания могла возникнуть только в России/Советском Союзе. Т.к. мы существуем не только благодаря 20 годам упорного труда, но также благодаря Научной школе с большой буквы. Мы существуем благодаря МФТИ и еще десятку лучших вузов страны, благодаря нобелевским лауреатам Ландау, Капице, Семенову и другим, которые создавали МФТИ и участвовали в создании других лучших ВУЗов нашей страны. 700 сотрудников нашей компании из более чем тысячи живет и работает в России. 99% наших инженеров и ученых родились и работают в России. Это наша страна. И мы патриоты нашей страны. И патриотизм мы видим в том, чтобы делать свое дело лучше всех в мире. Мы посвятили этому свою жизнь и добились того, что нашими технологиями гордится Россия. Сегодня технологиями ABBYY FineReader и ABBYY Lingvo пользуется более 30 миллионов человек в 130 странах мира. Мы работаем над прорывными технологиями, которые позволят людям всего мира понимать друг друга, общаясь на разных языках. И, когда мы этого добьемся, этими технологиями будет пользоваться 300 миллионов человек во всем мире. И каждый россиянин будет гордиться тем, что эти технологии созданы в России, так же, как и каждый американец гордится, что компания Apple, Google и Microsoft появились в США. Еще раз повторюсь, я считаю, что если мое государство делает что-то правильное и полезное, то сотрудничать с ним можно и нужно.

-Q27- Вы состоите в партии «Единая Россия» — партии жуликов и воров? А Давид Ян?

-A7- Нет, ни я, ни Давид, не состоим в Единой России.
Каждый должен заниматься своим делом.
Мы занимаемся тем, что умеем делать действительно хорошо.

-Q28- Очевидно, что расплатой за эти деньги
будет часть прибыли, рассматривали ли вы иные варианты,
насколько это предложение было близко к другим вариантам приема инвестиций?

Это было исключительно финансовое решение
или были дополнительные причины воспользоваться именно этим предложением, например, помочь государству продемонстировав, что идея Сколково жизнеспособна, получив скидку на взятки/откаты плюс дополнительный административный ресурс для зашиты от них или закрепить свою репутация первопроходцев инноваторов у российской аудитории и т.п.?

-A29- Мы очень избирательны
в получении инвестиций и не готовы брать деньги на любых условиях.

Финансовая поддержка от фонда Сколково выгоднее
других возможных способов финансирования нашей работы по этому проекту!

AiBollid
03-15-2011, 01:10 AM
PS: Третья часть ориентировочно 20-22 марта 2011

AiBollid
09-10-2011, 09:51 PM
Must Read: [b]Марвин Мински[b] (MIT, AI/HCI/KE):
- "Фреймы для представления знаний: 1053K

http://lib.rus.ec/b/274991/read

http://lib.rus.ec/a/3732

AiBollid
09-13-2011, 08:34 AM
04_JUL-2011.. Размер мозга коррелирует с общительностью: В ходе антропогенеза происходило стремительное, по эволюционным меркам, увеличение мозга. Важным стимулом этого процесса было усложнение общественной жизни и необходимость понимать мотивы соплеменников.

Быстрое увеличение мозга в эволюции гоминид предположительно было связано с развитием «социального интеллекта», то есть умственных способностей, направленных на понимание поступков и мотивов соплеменников и эффективное взаимодействие с ними. Венгерские нейробиологи показали, что эта теория приложима и к индивидуальным различиям в размере мозга у современных людей. Оказалось, что социабельность человека положительно коррелирует с размером лобных и височных долей, неокортекса и всего конечного мозга.

Согласно гипотезе «социального интеллекта» (Social Intelligence Hypothesis), или «макиавеллиевского интеллекта» (R. W. Byrne. Machiavellian Intelligence, PDF, 1,2 Мб), увеличение мозга в эволюции приматов вообще и гоминид в частности было неразрывно связано с общественным образом жизни. У приматов между особями в группе формируются сложные взаимоотношения и «личные связи», которые у других животных, как правило, бывают только между матерью и детенышами, реже (у моногамных видов) — между брачными партнерами. Для поддержания этих отношений общественному примату необходимо понимать поступки и мотивы соплеменников, а это крайне сложная и «ресурсоемкая» вычислительная задача. Ведь соплеменники, чье поведение нужно научиться моделировать у себя в голове, сами являются высокоорганизованными приматами со сложным поведением, предки которых тоже находились под действием отбора на «социальный интеллект». Если статус и репродуктивный успех особей в группе начинает зависеть от их социального интеллекта, это может породить положительную обратную связь («эволюционную гонку вооружений»), что ведет к ускоренному увеличению мозга в череде поколений..

Теория социального интеллекта подтверждается положительными корреляциями между размером мозга (или неокортекса) у приматов (а в ряде случаев также у хищных и копытных) с различными показателями сложности общественных отношений (размер группы, частота образования «коалиций» внутри группы, частота случаев социального обучения, наличие устойчивых семейных пар и т. д.)..

Исходя из этого, логично предположить, что у современных людей размер мозга может коррелировать с социально-ориентированными умственными способностями. По итогам многолетних исследований наибольшую поддержку получила пятифакторная модель — так называемая «большая пятерка» (Big Five). В неё входят следующие пять базовых психологических характеристик или «измерений»: экстраверсия, доброжелательность, добросовестность, невротизм и открытость опыту... ...
... http://elementy.ru/news/431614

AiBollid
09-17-2011, 09:32 PM
22-JUL-2011.. Искусственные синапсы копируют механизмы человеческой памяти... ... http://science.compulenta.ru/624010/

AiBollid
09-17-2011, 11:56 PM
Реконструкция всеобщей истории [только текст]
2M (книга прочитана 3788 раза) ==> http://lib.rus.ec/b/315243

Анатолий Тимофеевич Фоменко, Глеб Владимирович Носовский:

from Publishers:
Аннотация:
Эта книга предназначена для читателей, которые УЖЕ ЗНАКОМЫ
с проблемой обоснования хронологии «древности», и с современным естественно-научным подходом к этому вопросу. От читателя предполагается по меньшей мере знакомство например с книгой Г. В. Носовского и А. Т. Фоменко «Введение в новую хронологию» (Москва, изд-во Крафт-Леан, 1999). Подробнее с этой проблемой можно ознакомиться по другим их книгам, посвященным хронологии.
В этой книге авторы, как правило, НЕ ОБОСНОВЫВАЮТ свою точку зрения, так как это привело бы к сильному увеличению объема и фактическому повторению всего того, что уже было сказано в предыдущих книгах. Здесь формулируется лишь РЕКОНСТРУКЦИЯ ВСЕОБЩЕЙ ИСТОРИИ, излагаемая в виде краткого учебника. ЗА ДОКАЗАТЕЛЬСТВАМИ АВТОРЫ ОТСЫЛАЮТ К ПРЕДЫДУЩИМ КНИГАМ по новой хронологии.
Авторы отнюдь не претендуют на высокую точность предлагаемых датировок. Потребуется еще большая работа, чтобы уточнить новую короткую хронологию и некоторые выдвигаемые гипотезы. Поэтому авторы пытаются реконструировать подлинную историю пока лишь «по векам», то есть указывая век того или иного события, но обычно не уточняя дату внутри века.
Книга написана так, что ее чтение не потребует от читателя никаких специальных знаний. Требуется лишь интерес к русской и всеобщей истории и желание разобраться в ее многочисленных загадках. Предназначена для самых широких кругов читателей, интересующихся применением естественно-научных методов в хронологии и истории.

FROM VIP читателей: Самая крутая альт-история за 35 лет жанра!

"Окончательная" книга проф Фоменко и его бaрменталя... Занимательный обзор 12 главных монографиий автора окончательно расcтавляющий точки над ё! Моё мнение - читать пoтриотам и космопaлитам! Неожиданный взгляд на иудейcтвo..
---PS: Автoра читал много но! - бесссистемно, IQ пошаливало.. но, теперь благодаря академику Фоменко и тысячам псевдо-параллельных реальностей либрусека - мой окончательный диагноз - История - не трёхмерна, а 4x-мерна, и намёк Автора на тех, кто осуществил Минимальное "Необходимое" Воздействие - разрушив 1-ю общечеловеческую Империю - не затрагивает нах за спиной галактических рeйдеров/эксплуататоров! ---FYI: правила Галактической Конфедерации Мыслячеств - требуют от новичков - Общепланетарного Государства-Цивилизации - дабы получить защиту от хищных соседей и право на независимое развитие и колонизацию до 12 терраподобных планет! Оценка: отлично!

AiBollid
09-17-2011, 11:57 PM
--------------------- http://lib.rus.ec/b/319730
04-SEP-2011.. "Homo Ludens", Йохан Хейзинга
От издателей:
Книга продолжает издание избранных произведений выдающегося нидерландского историка и культуролога. Классическая работа Homo Ludens [Человек играющий] посвящена всеобъемлющей сущности феномена игры и универсальному значению ее в человеческой цивилизации. Статьи Задачи истории культуры, Об исторических жизненных идеалах, Политическое и военное значение рыцарских идей в позднем Средневековье, Проблема Ренессанса всесторонне рассматривают актуальные до сих пор философские и методологические вопросы в сфере истории и культорологии. раскрывают теоретические и нравственные основы подхода Й. Хейзинги к истории и культуре Публикуемые произведения, с их анализом фундаментальных проблем теории и истории культуры, отмечены высокой научной ценностью, ясностью и убедительностью изложения, яркостью и разнообразием фактического материала, широтой охвата, несомненными художественными достоинствами.

Аннотация oт VIP-читателей:
Неплохо для общего развития.. и автор сильно опередил своё время (1938).. Переводчик молодец, но мы бы предпочли 24-страничную выжимку из этого раритетa для разработчиков Виртуальных Вэб Реальностей и Игровых компонент - of the Decision Support/Advisor System, based on Behavioral Science & Artificial Intelligence.. ... ...И вообще - мы и Стругацкие как-то уже привыкли к современному определению Homo-Ludenus, разширив его до Детей Индиго..