|
РАЗРАБОТКА ТЕКСТОВОЙ БАЗЫ НА ОСНОВЕ АНАЛИЗА СТРУКТУРЫ НАУЧНОГО ТЕКСТА
By: Анастасия Дыбина
(2861 reads)
Rating:
(1.00/10)
|
Аннотация: В статье описан алгоритм построения текстовой базы, основанный на анализе
структуры научного текста, понимаемого как связного, в терминах когезии и когерентности в
рамках лингвистики текста. Исследования проводятся в области автоматического реферирования с
целью построения интеллектуальной системы, основанной на глубинной семантике текста.
Ключевые слова: автоматическое реферирование, текстовая база, структура текста, связный
текст, когезия, когерентность.
ACM Classification Keywords: E. Data, E.2 Data storage representation.
Link:
РАЗРАБОТКА ТЕКСТОВОЙ БАЗЫ НА ОСНОВЕ АНАЛИЗА СТРУКТУРЫ
НАУЧНОГО ТЕКСТА
Анастасия Дыбина
http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p11.pdf
|
СТРУКТУРИЗАЦИЯ ПРОСТРАНСТВА ФАКТОРОВ ДЛЯ УСТАНОВЛЕНИЯ ПРЕДВАРИТЕЛЬНОГО ...
By: Николай Маляр, Павел Мулеса
(3359 reads)
Rating:
(1.00/10)
|
Abstract: При построении диагностических систем в медицине предлагается использовать
структуризацию пространства факторов, влияющих на установление диагноза заболевания.
Приводится пример структуризации для диагностирования мочекаменного заболевания в урологии.
Keywords: экспертная система; пространство факторов; классификация; стратификация;
ранжирование; диагностические системы в медицине.
ACM Classification Keywords: H 1.1. Systems and Information Theory
Link:
СТРУКТУРИЗАЦИЯ ПРОСТРАНСТВА ФАКТОРОВ ДЛЯ УСТАНОВЛЕНИЯ
ПРЕДВАРИТЕЛЬНОГО ДИАГНОЗА УРОЛОГИЧЕСКИХ ЗАБОЛЕВАНИЙ
Николай Маляр, Павел Мулеса
http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p10.pdf
|
НЕЧЕТКИЕ ПРОЦЕДУРЫ ПОСЛЕДОВАТЕЛЬНОГО АНАЛИЗА ВАРИАНТОВ В КОМБИНАТОРНЫХ ...
By: Николай Маляр, Оксана Швалагин
(3374 reads)
Rating:
(1.00/10)
|
Аннотация: Предлагаются нечеткие процедуры последовательного анализа вариантов в
комбинаторных оптимизационных задачах с целью их использования для построения алгоритмов
последовательного анализа, отсеивания и конструирования вариантов в условиях нечеткости.
Описывается схема нечеткого алгоритма W последовательного анализа для дискретных задач
математического программирования и ее приложения к нечеткой задаче классификации.
Ключевые слова: последовательный анализ вариантов, нечеткость, задача классификации.
ACM Classification Keywords: H.4.2 Information Systems Applications: Types of Systems: Decision Support.
Link:
НЕЧЕТКИЕ ПРОЦЕДУРЫ ПОСЛЕДОВАТЕЛЬНОГО АНАЛИЗА ВАРИАНТОВ В
КОМБИНАТОРНЫХ ОПТИМИЗАЦИОННЫХ ЗАДАЧАХ И ИХ ПРИМЕНЕНИЕ
Николай Маляр, Оксана Швалагин
http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p09.pdf
|
РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТАЛЬНОГО ИССЛЕДОВАНИЯ ЭФФЕКТИВНОСТИ АЛГОРИТМА ...
By: Павел П. Антосяк
(3054 reads)
Rating:
(1.00/10)
|
Аннотация: В работе представлены результаты экспериментальных исследований эффективности
процедур последовательного анализа вариантов для задачи линейного упорядочения альтернатив.
Тестирование проводилось на реальных наборах данных (экономические таблицы «затратывыпуск»
ряда европейских стран) и случайных наборах данных, полученных на основании равномерного
распределения. Реализован сравнительный анализ с некоторыми приближенными алгоритмами.
Ключевые слова: задача линейного упорядочения альтернатив, последовательный анализ
вариантов.
ACM Classification Keywords: H.4.2 Information Systems Applications: Types of Systems: Decision Support.
Link:
РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТАЛЬНОГО ИССЛЕДОВАНИЯ ЭФФЕКТИВНОСТИ
АЛГОРИТМА ПОСЛЕДОВАТЕЛЬНОГО АНАЛИЗА ВАРИАНТОВ ДЛЯ ЗАДАЧИ
ЛИНЕЙНОГО УПОРЯДОЧЕНИЯ АЛЬТЕРНАТИВ
Павел П. Антосяк
http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p08.pdf
|
МУЛЬТИАГЕНТНЫЕ ТЕХНОЛОГИИ ИНТЕЛЛЕКТУАЛЬНОГО УПРАВЛЕНИЯ В ТЕЛЕКОММУНИКАЦИОННЫХ СИ
By: Адиль Тимофеев
(2756 reads)
Rating:
(1.00/10)
|
Аннотация: Рассматриваются проблемы и методы интеллектуального сетевого управления
информационными потоками в мультиагентных телекоммуникационных системах и GRID-сетях.
Значительное внимание уделяется принципам построения и оптимизации сетевых и нейросетевых
агентов, обеспечивающих интеллектуальный анализ информационных потоков и адаптивное
сетевое управление в условиях неопределённости в нечёткой среде.
Keywords: интеллектуальное управление, мультиагентные технологии, телекоммуникационные
системы, GRID-сети.
ACM Classification Keywords: E.4 CODING AND INFORMATION THEORY
Link:
МУЛЬТИАГЕНТНЫЕ ТЕХНОЛОГИИ ИНТЕЛЛЕКТУАЛЬНОГО УПРАВЛЕНИЯ В
ТЕЛЕКОММУНИКАЦИОННЫХ СИСТЕМАХ И GRID-СЕТЯХ
Адиль Тимофеев
http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p07.pdf
|
АППРОКСИМАЦИЯ ФУНКЦИИ ЯРКОСТИ ОБЪЕКТА ПОЛУТОНОВОГО ИЗОБРАЖЕНИЯ
By: Калмыков et al.
(3571 reads)
Rating:
(1.00/10)
|
Abstract The method, to encode the gray-scale image objects, is proposed, using canonical splines within the
gray-scale image structural model. While the brightness values of object pixels are determined inside its contour,
the approximation function is determined and built within rectangle which the object is circumscribed. Examples of
the image encoding, initially set in a raster kind, are made.
Keywords: полутоновое изображение, контур, канонический сплайн.
ACM Classification Keywords: I.5.1 Models, I.3.5 Computational Geometry and Object Modeling.
Link:
АППРОКСИМАЦИЯ ФУНКЦИИ ЯРКОСТИ ОБЪЕКТА ПОЛУТОНОВОГО
ИЗОБРАЖЕНИЯ
Владимир Калмыков, Виталий Вишневский,
Татьяна Романенко, Татьяна Власова
http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p06.pdf
|
УНИВЕРСАЛЬНАЯ СИСТЕМА ПРОГРАММ МОРФОЛОГИЧЕСКОГО АНАЛИЗА НАУЧНО-ТЕХНИЧЕСКИХ ...
By: Надежда Мищенко
(3368 reads)
Rating:
(1.00/10)
|
Abstract. This paper describes the software package FEST, which includes a universal program for
morphological analysis of scientific and technical texts, MORPH, and several other programs generating data for
MORPH. This data includes the morphological tables of a specific input language belonging to the permissible
class of inflectional and agglutinative languages and a dictionary. The programs included in the FEST package
generate the input language data for the MORPH program using formal descriptions of morphology and
vocabularies created by a human expert who knows the language. The analysis strategy is based on an
alternation of left-to-right and right-to-left analysis order. The dictionary of the input language contains stems
rather than lexemes or word-forms, and consists of several dictionaries, each containing stems of the same
length. The stems in the dictionary are accompanied by the grammar information, allowing all the word-forms of
the input text to be recognized. The analysis strategy, the structure of the morphological tables and vocabularies
enable morphological analysis of all word-forms with stems from dictionary.
Key words: the software package for morphological analysis, formal descriptions of morphology, formal
descriptions of lexemes, morphological tables generation, vocabularies generation, results of morphological
analysis (description and example).
ACM Classification Keywords: I.2.7. Natural Language Processing – Text analysis.
Link:
УНИВЕРСАЛЬНАЯ СИСТЕМА ПРОГРАММ МОРФОЛОГИЧЕСКОГО АНАЛИЗА
НАУЧНО-ТЕХНИЧЕСКИХ ТЕКСТОВ НА ФЛЕКТИВНЫХ И АГГЛЮТИНАТИВНЫХ
ЯЗЫКАХ
Надежда Мищенко
http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p05.pdf
|
РЕФОРМА УКРАИСКОГО НАЦИОНАЛЬНОГО ОБРАЗОВАНИЯ, ОСНОВАННАЯ НА МЫШЛЕНИИ
By: Александр Сосницкий
(2781 reads)
Rating:
(1.00/10)
|
Резюме: В статье рассматривается концепция новой модели системы украинского национального
образования, основанной на развитии мышления, позволяющего получать дополнительные знание и
понимание путем логического вывода. Обсуждаются четыре последовательно развивающиеся
базовые компоненты модели: электронные технологии образования, электронная организация
образования, мировые стандарты образования, технологии гениального воспитания и образования.
Предлагаются способы реализации такой системы.
Ключевые слова: реформа образования, концепция системы национального образования,
электронные технологии образования, мировые стандарты образования, технология гениального
воспитания и образования.
ACM Classification Keywords: H.0 Information systems – General
Link:
РЕФОРМА УКРАИСКОГО НАЦИОНАЛЬНОГО ОБРАЗОВАНИЯ, ОСНОВАННАЯ
НА МЫШЛЕНИИ
Александр Сосницкий
http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p04.pdf
|
О ПРИМЕНЕНИЯ СИСТЕМОЛОГИЧЕСКОГО КЛАССИФИКАЦИОННОГО АНАЛИЗА ЗНАНИЙ ...
By: Екатерина Соловьева, Андрей Данилов
(2757 reads)
Rating:
(1.00/10)
|
Аннотация: Знания являются главным ресурсом организации, государства, человека; основным
фактором повышения их конкурентоспособности и устойчивого развития. В связи с увеличением
спроса на знания, многие фирмы начинают все чаще использовать перспективные инструменты
управления знаниями, например социальные сети. Рассматривается актуальная задача повышения
эффективности функционирования социальных сетей на основе использования знаний и ноосферной
системной методологии - системологии. С этой целью разработана модель (диаграммы:
контекстная и 2-х уровней декомпозиции) процесса создания (выбора) и внедрения сайта социальной
сети в организации. Важной составляющей частью этого процесса является систематизация знаний
о той предметной области, для которой разрабатывается система функций нишевой социальной
сети. Применение нового метода системологического классификационного анализа при
систематизации знаний позволит: получить социальную сеть, наилучшим образом адаптированную
для соответствующей предметной области, к потребностям конкретной организации; определить
целесообразность использования различных функций в той или иной социальной сети. Это также
позволит сделать систему функций адекватной, удобной и интуитивно понятной пользователю, за
счет их содержательного размещения с учетом функционального назначения социальной сети.
Приведен фрагмент базовой классификации функций социальных сетей, построенный на основе
системологического классификационного анализа и реализованный в виде онтологии в программном
средстве построения онтологий Protégé 3.2. Приведен фрагмент классификации договоров,
использованной при создании эффективного меню социальной сети, а также его реализация в
конструкторе построения социальной сети Tabba. Применение социальных сетей, адаптированных
под требования пользователей, поможет компаниям существенно увеличить свой интеллектуальный
капитал, без использования крупных инвестиций; позволит улучшить использование таких сетей для
самосовершенствования и развития.
Ключевые слова: Системология, системологический классификационный анализ, классификация,
социальная сеть, модель, бизнес-процес, знаниеориентированные технологии, Интернет.
Link:
О ПРИМЕНЕНИЯ СИСТЕМОЛОГИЧЕСКОГО КЛАССИФИКАЦИОННОГО
АНАЛИЗА ЗНАНИЙ В ПРОЦЕССЕ ПОСТРОЕНИЯ НИШЕВЫХ СОЦИАЛЬНЫХ
СЕТЕЙ.
Екатерина Соловьева, Андрей Данилов
http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p03.pdf
|
ЦЕЛОСТНОСТЬ ОБРАЗОВ: О МОДЕЛИРОВАНИИ СМЫСЛА И ПОНИМАНИЯ
By: Юрий Валькман
(3468 reads)
Rating:
(1.00/10)
|
Abstract: Анализируются свойства неполноты и целостности структур знаний в интеллектуальных
системах. Рассматривается целостность знаний, представленных в вычислительной среде, с
позиций определения их смыслов и понимания. Анализируются свойства категории смысла в
приложении к образному мышлению. Исследование проводится с целью последующего построения
формальных структур знаний для моделирования процессов образно-понятийного мышления в
компьютерных технологиях.
Keywords: Образ, мышление, понимание, смысл, структура, система, целостность, модель,
компьютерная технология, база знаний, вычислительная среда.
ACM Classification Keywords: A.1 Information Technology for Knowledge Management; Е.1 Process-oriented
Knowledge Structuring; H.1.1 Systems and Information Theory; I.2.4 Knowledge Representation Formalisms and
Methods; J.4 Social and Behavioral Sciences; М.4 Intelligence Metasynthesis and Knowledge Processing in
Intelligent Systems.
Link:
ЦЕЛОСТНОСТЬ ОБРАЗОВ: О МОДЕЛИРОВАНИИ СМЫСЛА И ПОНИМАНИЯ
Юрий Валькман
http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p02.pdf
|
К ВОПРОСУ ВИЗУАЛИЗАЦИИ ОНТОГРАФОВ ПРИ РАЗРАБОТКЕ ОНТОЛОГИЙ ПРЕДМЕТНЫХ ДИСЦИПЛИН
By: Палагин А.В., Петренко Н.Г., Величко В.Ю., Тихонов Ю.Л.
(3283 reads)
Rating:
(1.00/10)
|
Аннотация. В работе описана методика, предназначенная для повышения эффективности
графического представления и выразительности онтологий предметных дисциплин (ПдД).
Предложена система индексации, ориентированная на машинное представление и обработку
онтографа ПдД, и оригинальный инструментарий, реализующий информационную технологию
построения онтологии ПдД и ее онтографа, электронных курсов обучения по различным ПдД.
Интерфейс содержит всплывающие подсказки, в которые включено имя понятия и время, необходимое
на изложение описания данного понятия, что поможет преподавателю выбрать конкретное
содержание учебного курса в соответствии с ограничениями “Рабочей программы” ПдД. Приведен
пример построения, визуализации и индексации онтографа ПдД “Базы данных” (БД).
Ключевые слова: онтологический инжиниринг, представление и обработку онтографа
ACM Classification Keywords: I.2 ARTIFICIAL INTELLIGENCE - I.2.4 Knowledge Representation Formalisms
and Methods, K.3 COMPUTERS AND EDUCATION - K.3.1 Computer Uses in Education
Link:
К ВОПРОСУ ВИЗУАЛИЗАЦИИ ОНТОГРАФОВ ПРИ РАЗРАБОТКЕ ОНТОЛОГИЙ
ПРЕДМЕТНЫХ ДИСЦИПЛИН БОЛЬШОГО ОБЪЕМА
Палагин А.В., Петренко Н.Г., Величко В.Ю., Тихонов Ю.Л.
http://www.foibg.com/ijitk/ijitk-vol06/ijitk06-1-p01.pdf
|
ПРОБЛЕМЫ СОВРЕМЕННОГО РЫНКА ЗНАНИЙ
By: Крассимир Марков
(4641 reads)
Rating:
(1.00/10)
|
Аннотация: В статье рассматриваются некоторые проблемы, связанные с возникновением и
развитием современного рынка знаний, который постепенно занимает основное место среди всех
форм обмена знаниями.
Link:
ПРОБЛЕМЫ СОВРЕМЕННОГО РЫНКА ЗНАНИЙ
Крассимир Марков
http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-4-p04.pdf
|
СИСТЕМА ПРЕДОСТАВЛЕНИЯ ДИСТАНЦИОННЫХ УСЛУГ В ОБРАЗОВАНИИ ...
By: Востров Г.Н. et al.
(3131 reads)
Rating:
(1.00/10)
|
Аннотация: В статье описываются модели управления распределенными информационными
процессами в системе образования. Приводится описание системы поддержки on-line и off-line
взаимодействия в сетевой среде, структуры сервера поддержки учебных взаимодействий как
элемента интеллектуальной информационной среды учебного назначения.
Ключевые слова: дистанционные услуги в образовании, модель поддержки процессов коллективного
взаимодействия, сервер поддержки учебных взаимодействий.
ACM Classification Keywords: I.2 ARTIFICIAL INTELLIGENCE - I.2.4 Knowledge Representation Formalisms
and Methods.
Link:
СИСТЕМА ПРЕДОСТАВЛЕНИЯ ДИСТАНЦИОННЫХ УСЛУГ В ОБРАЗОВАНИИ –
ХАРАКТЕРНЫЕ ТЕХНОЛОГИЧЕСКИЕ ОСОБЕННОСТИ
Востров Г.Н., Годынский М.Г., Кальной С.П.,
Лысенко М.И., Павлов О.А, Стрижак О.Е.
http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-4-p03.pdf
|
ИНСТРУМЕНТЫ ПОДДЕРЖКИ ПРОЦЕССОВ АНАЛИТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ ЭКСПЕРТА ...
By: А.В. Палагин, В.Ю. Величко, А.Е. Стрижак, М.А. Попова
(3125 reads)
Rating:
(1.00/10)
|
Аннотация: В статье приведена обобщенная структура обеспечения доступа к распределенным
информационным ресурсам. Описаны инструменты проведения контент-анализа документов на
основе системно-онтологического подхода. Приведен пример использования инструментов
экспертом-аналитиком при обработке тематических документов по проблеме изменения климата.
Ключевые слова: представление и обработка знаний, тематический анализ документов, поисковая
система.
ACM Classification Keywords: I.2 ARTIFICIAL INTELLIGENCE - I.2.4 Knowledge Representation Formalisms
and Methods,
Link:
ИНСТРУМЕНТЫ ПОДДЕРЖКИ ПРОЦЕССОВ АНАЛИТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ
ЭКСПЕРТА ПРИ ТЕМАТИЧЕСКОМ ИССЛЕДОВАНИИ ИНФОРМАЦИОННЫХ
РЕСУРСОВ И ИСТОЧНИКОВ
А.В. Палагин, В.Ю. Величко, А.Е. Стрижак, М.А. Попова
http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-4-p02.pdf
|
ОБНАРУЖЕНИЕ ЗНАНИЙ НА ОСНОВЕ СЕТЕВЫХ СТРУКТУР
By: Гладун В.П.
(3072 reads)
Rating:
(1.00/10)
|
Аннотация: Рассматриваются требования к организации памяти интеллектуальных систем.
Одновременно с вводом информации в памяти должны осуществляться процессы формирования
ассоциативных связей, иерархического упорядочения, классификации, формирования понятий.
Сформулированным требованиям удовлетворяют растущие пирамидальные сети (РПС).
Обсуждаются достоинства РПС, приведены последние версии алгоритмов построения и обучения
РПС, а также архитектура програмной системы поддержки принятия решений на основе сетевой
модели предметной области. Многолетний опыт применения РПС для анализа данных и принятия
решений в химии, материаловедении, технической диагностике подтверждает их достаточно
высокие возможности.
Ключевые слова: представление и обработка знаний, растущие пирамидальные сети.
ACM Classification Keywords: I.2 ARTIFICIAL INTELLIGENCE - I.2.4 Knowledge Representation Formalisms
and Methods
Link:
ОБНАРУЖЕНИЕ ЗНАНИЙ НА ОСНОВЕ СЕТЕВЫХ СТРУКТУР
Гладун В.П.
http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-4-p01.pdf
|
OPTIMISATION OF ROUTE-PLANNING UNDER INDEFINITE RISK CONDITIONS
By: Kuzemin Oleksandr, Berezhnoy Sergey, Dayub Yasir
(2942 reads)
Rating:
(1.00/10)
|
Abstract: This paper describes an algorithm of data transformation with a view to provide support for the decision
maker. The aim of the paper is to develop a multi-purpose algorithm of building sets of optimal routes, taking into
consideration most of the real factors that provoke risks. A simple and effective method of multicriteria
optimization was proposed and developed.
Keywords: emergency situations, microsituations, road conditions, weather conditions, objects of high danger,
multicriteria optimisation.
ACM Classification Keywords: H.1 Models and Principles – General
Link:
OPTIMISATION OF ROUTE-PLANNING UNDER INDEFINITE RISK CONDITIONS
Kuzemin Oleksandr, Berezhnoy Sergey, Dayub Yasir
http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-3-p08.pdf
|
APPLICATION OF MATHEMATICAL INDUCTION FOR INHERITANCE LAW INERPRETATIONS
By: Assen Tochev, Vassil Guliashki
(3615 reads)
Rating:
(1.00/10)
|
Abstract: The purpose of this article is to obtain simple rule for applying the Inheritance law for the case of (own)
brothers/sisters by birth, and/or brothers/sisters uterine or through father. Using the mathematical induction a
result is obtained for n (own) brothers/sisters by birth and m brothers/sisters uterine or through father.
Keywords: Inheritance law, mathematical induction.
ACM Classification Keywords: A.0 General Literature - Conference proceedings; I. Computing methodologies,
I.2. Artificial Intelligence, I.2.1. Applications and expert systems, Subject descriptor: Law; H. Information systems,
H4. Information systems application, H.4.2. Types of systems, Subject descriptor: Decision support;
Link:
APPLICATION OF MATHEMATICAL INDUCTION FOR
INHERITANCE LAW INERPRETATIONS
Assen Tochev, Vassil Guliashki
http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-3-p07.pdf
|
MODEL RESEARCH OF INTERACTION PROCESSES OF TEXT SPACES
By: Konstantin I. Belousov, Tatyana N. Galinskaya
(2770 reads)
Rating:
(1.00/10)
|
Abstract: The article discusses the problem of interaction of text spaces. When discussing the interaction of text
spaces we assume that there exists a certain text model. The technique of semantic charting and the method of
positional analysis allowed us to represent the successive-simultaneous semantic space of a text as its “semantic
outline”. Owing to the method of the prosodic analysis of a text, aimed at modeling its prosodic outline, there
appears the possibility to analyze the cooperative interactions of these relatively independent text spaces. The
system-approached research program presented in the work is aimed at the study of the text as a polyontological,
self-organizing spatiotemporal linguistic object. The multiaspect text analysis is grounded on a) the positional
analysis method, b) quantitative methods which in there turn comprise such methods as c) correlation methods,
which determine the text aspects’ level. By comparing and contrasting synchronically semantic connection
intensity and mean sound intensity of the obtained data we received the results that allow us to be more specific
in the discussion of the text structure as an evolving process. The search for explanatory tools of convergence,
divergence, intersection, overlapping of various text structures is the key to understanding the complex material,
ideal and social nature of text, its presentation as wholeness.
Keywords: system activity approach, modeling, positional analysis, semantic charts, semantic graph of a text.
Link:
MODEL RESEARCH OF INTERACTION PROCESSES OF TEXT SPACES
Konstantin I. Belousov, Tatyana N. Galinskaya
http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-3-p06.pdf
|
THE EXPERIENCE OF DEVELOPING SOFTWARE FOR TYPOLOGICAL DATABASES ...
By: Vladimir Polyakov
(3213 reads)
Rating:
(1.00/10)
|
Abstract: In the present article we will discuss the experience of creating software for the typological database
“Languages of the World”. The DB “Languages of the World” is one of the biggest typological computer
resources. We have done a review of the software connected with the DB “Languages of the World”. The
following questions are discussed: compatibility of the versions, choice of the best structure of the data,
development of the content in newer versions of the DB, creation of bilingual version, correct citing. The main
lessons learnt from the project by the workgroup, are:
Long development and creation of different versions of the product during its life cycle (over 20 years), providing
its livability against the background of changing of operational systems and paradigms of programming makes us
seriously think about a technology of providing for compatibility between different versions of the product,
documenting of the code, preserving the key participants of the workgroup.
The structure of the DB is a secondary moment in the relation to the content. In the end, choice of a certain
structure of data presentation in a certain realization of the product is a question of comfortable programming.
Besides, choice of the structure of the data is in many situation defined by the environment of data storage, dates
and budget of the product.
Planning a long life cycle of a linguistic resource for scientific purposes must foresee tools of fixation and
archiving the inevitable changes of the content. Lack of such tools or links to the contents without invariant
binding lowers the quality and the value of the received scientific results.
The creation of the bilingual version of the product demanded thorough elaboration of the terminological part of
the DB, as well as linkage of the languages to the international system of coding. Along with it, the specificity of
Russian scientific linguistic school and a more detailed description of the languages of Eurasia in the DB
“Languages of the World” did not allow us to withdraw these contradictions completely.
The main scientific results received for the past 5 years with the use of the DB, are enumerated. The perspectives
of its future development and use are studied.
Keywords: language typology, linguistic database
Link:
THE EXPERIENCE OF DEVELOPING SOFTWARE FOR TYPOLOGICAL DATABASES
(ON THE EXAMPLE OF DB “LANGUAGES OF THE WORLD”)
Vladimir Polyakov
http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-3-p05.pdf
|
ANALYZING THE LOCALIZATION OF LANGUAGE FEATURES WITH COMPLEX SYSTEMS TOOLS ...
By: Samuel F. Omlin
(3332 reads)
Rating:
(1.00/10)
|
Abstract: Half of the world’s languages are in danger of disappearing before the century ends. Efficient
protection of these languages is difficult as their fate depends on multiple factors. The role played by the
geographic situation of a language in its survival is still unclear. The following quantitative study focused on the
relation between the ‘vitality’ of a minority language and the linguistic structure of the neighboring languages. A
large sample of languages in Eurasia was considered. The languages were described based on a complex
system of typological features. The spatial distribution of the language features in the sample area was measured
by quantifying deviations from purely random configurations. Interactions between the linguistic features were
revealed. The obtained interaction network permitted to define a location “quality” index for a language
localization. This index was put in relation to corresponding vitality estimations from Unesco. A significant relation
could be established between these two variables. The degree of endangerment of the minority languages
studied seems effectively related to the linguistic structure of their neighboring languages. Beyond the particular
context of endangered languages, the proposed approach constitutes a promising tool to gain more knowledge
about the mechanisms that control the geographical distribution of linguistic features.
Keywords: Language competition, Complex systems, Interactions, Spatial distribution, Typological language
features.
ACM Classification Keywords: I.m Miscellaneous; J.5 Arts and Humanities – Linguistics; H.2.8 Database
Applications – Data mining, Scientific databases, Spatial databases and GIS.
Link:
ANALYZING THE LOCALIZATION OF LANGUAGE FEATURES WITH COMPLEX
SYSTEMS TOOLS AND PREDICTING LANGUAGE VITALITY
Samuel F. Omlin
http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-3-p04.pdf
|
COMPARATIVE ANALYSIS OF PHYLOGENIC ALGORITHMS
By: Valery Solovyev, Renat Faskhutdinov
(2775 reads)
Rating:
(1.00/10)
|
Abstract The paper is dedicated to comparative analysis of phyogenetic algorithms used for linguistics tasks. At
present there are a lot of phylogenetic algorithms; however, there is no unanimous opinion on which of them
should be used. The paper suggests the model of language evolution trees and introduces a parameter to
characterize the topology of trees. The comparison of the main algorithms is made on the trees of various
topology. The paper displays that the UPGMA algorithm gives better results on the trees close to balanced ones.
It provides the explanation for a number of contradictive results, described in published works.
The problem of the input data choice and the relation between results and the number and type of parameters is
under consideration. The results obtained are also ambiguous. Typological databases “Jazyki mira” and WALS as
well as the method of computer modeling are used in the paper.
Keywords: language evolution, phylogenetic algorithms
Link:
COMPARATIVE ANALYSIS OF PHYLOGENIC ALGORITHMS
Valery Solovyev, Renat Faskhutdinov
http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-3-p03.pdf
|
SPAM AND PHISHING DETECTION IN VARIOUS LANGUAGES
By: Liana Ermakova
(3625 reads)
Rating:
(1.00/10)
|
Abstract: The majority of existing spam filtering techniques suffers from several serious disadvantages. Some of
them provide many false positives. The others are suitable only for email filtering and may not be used in IM and
social networks. Therefore content methods seem to be more efficient. One of them is based on signature
retrieval. However it is not change resistant. There are enhancements (e.g. checksums) but they are extremely
time and resource consuming. That is why the main objective of this research is to develop a transforming
message detection method. To this end we have compared spam in various languages, namely English, French,
Russian and Italian. For each language the number of examined messages including spam and notspam was
about 1000. 135 quantitative features have been retrieved. Almost all these features do not depend on the
language. They underlie the first step of the algorithm based on support vector machine. The next stage is to test
the obtained results applying trigram approach. Proposed phishing detection technique is also based on SVM.
Quantitative characteristics, message structure and key words are used as features. The obtaining results
indicate the efficiency of the suggested approach.
Keywords: spam, corpus linguistics, phishing, filtering, text categorization.
ACM Classification Keywords: I.2.7 Text analysis
Link:
SPAM AND PHISHING DETECTION IN VARIOUS LANGUAGES
Liana Ermakova
http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-3-p02.pdf
|
GRAMMATICAL PRIMING DOES FACILITATE VISUAL WORD NAMING, AT LEAST IN SERBIAN
By: Dejan Lalović
(3869 reads)
Rating:
(1.00/10)
|
Abstract: Starting from the seminal work in 1980s to more recent findings, literature review suggests
grammatical priming to be an elusive fenomenon, reliably obtained mostly in a lexical decision task and only
rarely in naming task. Prevalent conclusion derived from the aforementioned fact suggests the effects of
grammatical priming to be of less importance for online word processing as reflected by naming. However, this
goes against intuitive notion of grammatical information being especially valuable in processing richly-inflected,
free-word ordered language such as Serbian. The conclusion was challenged in a naming task in which
prepositions and personal pronouns were employed to prime target nouns and verbs. We also tested the effect of
prime-target asynchrony at 600ms and 250ms intervals, as the variable is known to invertly influence effects of
language priming. Delayed naming condition was used to provide a purer estimate of target processing time
afforded at the two asynchrony intervals in online naming. Analyses suggest effects of grammatical priming to be
both substantial and robust. The facilitation of 22 ms (25 ms at 600 ms asynchrony, 20 ms at 250 ms asynchrony)
provided by grammatical information was roughly twice as large as obtained in comparable studies in English.
The facilitation effect was not qualified by interaction with SOA and therefore should not be attributed to some
major strategic process associated with the longer SOA. We conclude grammatical priming in naming to be
possible, at least in case of richly-inflected, free word-ordered language, and more than one word class primed.
Online-delayed average latencies difference indicated slightly wider time window for target processing at the
shorter asynchrony. The fact requires caution in grammatical priming effects loci interpretation.
Keywords: grammatical priming; word naming.
ACM Classification Keywords: I.2 Artificial Intelligence; I.2.7 Natural Language Processing – Language parsing
and understanding.
Link:
GRAMMATICAL PRIMING DOES FACILITATE VISUAL WORD NAMING,
AT LEAST IN SERBIAN
Dejan Lalović
http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-3-p01.pdf
|
MULTILINGUAL REDUCED N-GRAM MODELS
By: Tran Thi Thu Van and Le Quan Ha
(3165 reads)
Rating:
(1.00/10)
|
Abstract: Statistical language models should improve as the size of the n-grams increases from 3 to 5 or higher.
However, the number of parameters and calculations, and the storage requirement increase very rapidly if we
attempt to store all possible combinations of n-grams. To avoid these problems, the reduced n-grams’ approach
previously developed by O’Boyle? 1993 can be applied. A reduced n-gram language model can store an entire
corpus’s phrase-history length within feasible storage limits. Another theoretical advantage of reduced n-grams is
that they are closer to being semantically complete than traditional models, which include all n-grams. In our
experiments, the reduced n-gram Zipf curves are first presented, and compared with conventional n-grams for all
Irish, Chinese and English. The reduced n-gram model is then applied for large Irish, Chinese and English
corpora. For Irish, we can reduce the model size, compared to the 7-gram traditional model size, with a factor of
15.1 for a 7-million-word Irish corpus while obtaining 41.63% improvement in perplexities; for English, we reduce
the model sizes with factors of 14.6 for a 40-million-word corpus and 11.0 for a 500-million-word corpus while
obtaining 5.8% and 4.2% perplexity improvements; and for Chinese, we gain a 16.9% perplexity reductions and
we reduce the model size by a factor larger than 11.2. This paper is a step towards the modeling of Irish, Chinese
and English using semantically complete phrases in an n-gram model.
Keywords: Reduced n-grams, Overlapping n-grams, Weighted average (WA) model, Katz back-off, Zipf’s law.
ACM Classification Keywords: I. Computing Methodologies - I.2 ARTIFICIAL INTELLIGENCE - I.2.7 Natural
Language Processing - Speech recognition and synthesis
Link:
MULTILINGUAL REDUCED N-GRAM MODELS
Tran Thi Thu Van and Le Quan Ha
http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-2-p07.pdf
|
THE ARGUMENT BASED COMPUTATION: SOLVING THE BINDING PROBLEM
By: Alona Soschen, Velina Slavova
(3042 reads)
Rating:
(1.00/10)
|
Abstract: In this paper, we further developed the argument-based model of syntactic operations that is argued to
represent the key to basic mental representations. This work concentrates on formal descriptions of the observed
syntax-semantics dependencies. We briefly review our up do date experimental work designed to test this
hypothesis, and offer the results of our most recent experiment. The results of our experiments confirmed that
semantic relations between the images in conceptual nets influence syntactic computation. The binding problem
that arises when the same noun can be represented either as Subject (ex. The cat chases the mouse) or Object
(ex. The mouse chases the cat
Introduction
), was successfully resolved.
Keywords: Cognitive Models of Language Phenomena, Formal Models in Language and Cognition,
Psycholinguistics and Psycho semantics
ACM Classification Keywords: ACM Classification Keywords: I.2 Artificial Intelligence, 1.2.0. Cognitive
simulation
Link:
THE ARGUMENT BASED COMPUTATION: SOLVING THE BINDING PROBLEM
Alona Soschen, Velina Slavova
http://www.foibg.com/ijitk/ijitk-vol04/ijitk04-2-p06.pdf
|
|
|