О самоограничении своих возможностей
avtar
[info]fedor_malyshkin

Как-то думал и понял, что свои собственные возможности мы часто ограничиваем самостоятельно. Например говоря: «Это слишком сложно для меня» или «Я не смогу это сделать».

Когда переступаешь через это – понимаешь, что всё вовсе не так сложно и вполне реализуемо, ну а после выполнения можно и плоды труда пожинать…

  • Leave a comment
  • Add to Memories

Синтаксический анализ. СГГ. Часть 2 (основные свойства систем синтаксических групп)
avtar
[info]fedor_malyshkin

В оригинальной работе посвящённой ССГ (А.В. Гладкий «Синтаксические структуры естественного языка») всё дано в достаточно точном математическом виде. Это имеет ярко выраженные плюсы и минусы.

Плюсы:

  • Свойства ССГ абсолютно понятны

Минусы:

Read more... )
  • Leave a comment
  • Add to Memories

Синтаксический анализ. СГГ. Часть 1
avtar
[info]fedor_malyshkin

К сожалению, ни деревья подчинения, ни системы составляющих не обеспечивают достаточно полного  полного и адекватного описания синтаксической структуры предложения. Остановимся на недостатках этих моделей подробнее, что бы можно было сделать выводы о способах их преодаления.

Главные пороки деревьев подчинения:

Read more... )
  • Leave a comment
  • Add to Memories

Почему лингвистические системы и работы, посвящённые им, такие сложно-замудрённые?
avtar
[info]fedor_malyshkin

Всегда мучался вопросом – «Почему лингвистические системы и работы, посвящённые им, такие сложно-замудрённые?»

Ответ нашёл в цитате из одной книги:

«…

Прежде всего, можно заметить, что качество перевода тем выше, чем полнее и принципиальнее модель языка, лингвистический компонент системы автоматического перевода.

Read more... )
  • Leave a comment
  • Add to Memories

Графематический модуль. Выделение предложений.
avtar
[info]fedor_malyshkin

Выделение предложений из сплошного текста – процедура необходимая для дальнейшего анализа текста в любой системе анализа естественных языков.

Read more... )
  • Leave a comment
  • Add to Memories

Потоковый JSON-парсер YAJL
avtar
[info]fedor_malyshkin

В связи, с возникшей недавно потребностью работе с данными в JSON-формате, решил исследовать вопрос о существующих библиотеках для работы с JSON для С/С++.

Сразу хочу оговориться, что детального рассмотрения всего множества библиотек для работы c JSON я представлять не собирался. На текущий момент их существует более-менее большое кол-во. Вот список с сайта json.org (http://www.json.org):

Read more... )
Tags: , ,

Об использовании аппаратных ресурсов многопроцессорных систем с использованием классического подхода
avtar
[info]fedor_malyshkin

Для тех, кто пытается использовать стандартный подход к разработке многопотоковых приложений, хочу представить перевод статьи фирмы «iMatrix» (бывший со-разработчик «RabbitMQ» и текущий разработчик библиотеки «ZMQ»), в котором ключевые программисты фирмы высказывают своё мнение о подобном подходе.

По мере появления свободного времени буду дополнять перевод...

Read more... )
  • Leave a comment
  • Add to Memories

HTML
avtar
[info]fedor_malyshkin

Спустя какое-то время поиска по Интернету понял, что мне необходимо в вопросах HTML: запрос в Google по ключу «admin template» - дал то, что я искал.


О разработке много-компонентных систем
avtar
[info]fedor_malyshkin
После некоторого времени разработки подобных систем на предыдущей работе и в текущем проекте, смог сделать несколько достаточно важных выводов о вопросах реализации подобных систем и решил донести их миру (благо – это прописные истины):
  • Модули должны иметь возможность стартовать, останавливаться и перезапускаться в любое время. Так, что бы не приходилось перезапускать или перенастраивать другие модули. Когда Ваше приложение выйдет на «боевые» сервера (денежный уровень) – перезапуск всей системы будет строить ОЧЕНЬ дорого.
  • Модули должны иметь возможность запускаться в нескольких экземплярах (желательно без переконфигурированя) – вопрос в полном использовании аппаратных мощностей (об этом в следующем посте).
  • Обмен должен производиться данными, которые не имеют привязки к языку, ОС, или аппаратной платформе, но имеют поддержку или средства обработки в любом языке и не портятся на другой аппаратной платформе. Это я понял, когда начал передавать данные с Ruby (32-bit Windows) на C++ (64-bit Linux). Я выбрал XML.
  • Блокирующие вызовы должны быть исключены как класс – все пишут медленный или глючный код и ждать пока что-то будет заниматься перебором массивов или какой-то модуль перезапустят - слишком дорого. Этот принцип следует закладывать уже в прототипах.
И конечно ещё несколько основных организационных выводов:
  • Протокол должен быть простым, но гибким (не ограниченным). Например, возьмите в качестве примера почтовые сообщения – кроме самого текста письма есть ещё заголовки (не поля «От», «Тема» и прочее, а системные). В них хранится и информация о маршруте движения, как оно было обработано, что в нём, формат, размер и прочая полезная информация.
  • Он должен быть записан и задокументирован (форматы, взаимодействие модулей для всех случаев). Почему? Добавьте ещё 2-х разработчиков и узнаете.
  • 10
  • Leave a comment
  • Add to Memories

Почему веб-приложение для управления проектом?
avtar
[info]fedor_malyshkin
Почему веб-приложение для управления проектом?

Почему я выбрал в качестве средства управления проектом (редактирование/ввод данных, управление агентами, мониторинг) - веб-приложение? Ведь проще реализовать это в виде «батников», скриптов или толстых клиентов.
Ответов пара:
  • Веб-приложение не зависит от платформы (где работает браузер – там работает и оно)
  • Это проще и нагляднее
  • Веб-приложение всё так же остаётся представителем трехзвенной архитектуры, что оставляет возможность перемещать части как угодно
  • Реализовать закрытое соединение проще простого
При создании веб-приложений столкнулся с очевидной для меня проблемой: отсутствие дизайна.
Нет хороших стилей для списков, таблиц, элементов форм, всяких заголовков и прочих элементов, графики для декорирования страницы, всяких анимированных значков для AJAX. Всё конечно работает, но выглядит, мягко сказать, аскетично.

На прошлой работе, мы заказывали дизайнерскому агентству макет сайта, в котором была куча всего, что я перечислил (стили, графика для декорирования, разметка) в разных комбинациях и из него составляли своё приложение – выходило хорошо.

Сейчас нахожусь в состоянии вяло текущего поиска подобного шаблона для «вырывания» кусков для собственных приложений.

Решил даже поместить такой заголовок на «шапку» сайта проекта «Проект "Анализ естественных языков"».

Tags:
  • Leave a comment
  • Add to Memories

You are viewing [info]fedor_malyshkin's journal