Статья
The Physical and Geometric Properties of Human Transposon Stem–Loop Structures under Natural Selection
Втоpичные cтpуктуpы PНК игpают важную pоль в тpанcпозиции, в чаcтноcти, в pаcпознавании PНК белками тpанcпозонов. Pанее мы обнаpужили конcеpвативную cтpуктуpу на 3′-конце
тpанcпозонов человека и выдвинули гипотезу о ее pоли в тpанcпозиции. Неcмотpя на полное отcутcтвие cxодcтва на уpовне поcледовательноcтей, конcеpвативное положение cтpуктуpы говоpит о наличии cвойcтв, на котоpые дейcтвует положительный эволюционный отбоp. В данной pаботе опpеделены физичеcкие и геометpичеcкие cвойcтва cтpуктуp «cтебель–петля» на 3′-конце тpанcпозонов человека и cpавнение иx cо cвойcтвами cтpуктуp из дpугиx облаcтей генома. Каждая cтpуктуpа «cтебель–петля» была оxаpактеpизована набоpом из деcяти xаpак- теpиcтик: cвободной энеpгией Гиббcа, энтальпией, энтpопией, гидpофильноcтью, Shift, Slide, Rise, Tilt, Roll и Twist. C помощью методов машинного обучения поcтpоена модель, котоpая pаcпознает cтpуктуpы тpанcпозонов по физичеcким и геометpичеcким cвойcтвам c 94% cтепенью точноcти. Наибольший вклад в pаcпознавание cтpуктуp внеcли гидpофильноcть, энтальпия, паpаметpы Rise и Twist. Пpедполагаетcя, что именно эти cвойcтва cтpуктуp тpанcпозонов наxодятcя под дейcтвием положительного эволюционного отбоpа.
Труды содержат доклады, представленные учеными из России, Украины, Белоруссии, Казахстана, Эстонии, Узбекистана, Германии, Польши, посвященные актуальным проблемам радиационной физики твердого тела (влияние радиации на физико-химические свойства и структуру металлических, полупроводниковых и диэлектрических материалов, влияние факторов космического пространства на свойства конструкционных и функциональных материалов и покрытий космических аппаратов, радиационно-технологические методы получения материалов, в частности наноматериалов, модифицирования и обработки материалов с целью улучшения их эксплуатационных свойств, создание и получение экологически чистых материалов с низкой наведенной радиоактивностью и др.).
Изучаются свойства меры Эрдеша и инвариантной меры Эрдеша для золотого сечения и всех значений параметра Бернулли. Доказывается, что сдвиг на двустороннем компакте Фибоначчи с инвариантной мерой Эрдеша изоморфен интегральному автоморфизму над автоморфизмом Бернулли со счетным алфавитом. Предложен эффективный алгоритм вычисления энтропии инвариантной меры Эрдеша. Показано, что для определенных значений параметра Бернулли этот алгоритм дает хаусдорфову размерность меры Эрдеша с пятнадцатью десятичными знаками.
С развитием автоматизированных систем прогнозирования успеха кинофильмов, актуальным представляется вопрос «В одинаковой степени предсказуемы кинофильмы из разных сегментов или нет?». Зная ответ на него, инвестор может либо обходить проблемные сегменты стороной, либо проводить более детальный анализ (в том числе качественный) кинопроектов, попадающих в проблемный сегмент. В статье между собой сравниваются такие методы классификации с обучением, как логистическая регрессия, MLP (Multilayer Perceptron – разновидность нейронных сетей), KNN (k-Nearest Neighbors – метод k ближайших соседей), CART (Classification and Regression Trees), SVM (Support Vector Machines), BP (Boosted Trees) и RF (Random Forest). Кроме того, для ответа на вопрос «В одинаковой степени предсказуемы кинофильмы из разных сегментов или нет?» применяется оригинальная методика выявления сегментов с высокой и низкой ошибкой предсказания. Проведенная диагностика является примером того, как исследователь может оценить однородность качества классификации и понять, для каких сегментов объектов может быть получен удовлетворительный прогноз, а какие сегменты лучше либо избегать, либо привлекать для их оценки экспертов.
В сборнике представлены тезисы докладов 12-й Международной конференции "Интеллектуализация обработки информации", проводимой Российской академией наук, Федеральным исследовательским центром "Информатика и управление" РАН, Научно-координационный центром "Цифровые методы интеллектуального анализа данных". Конференция проводится с 1989 г., начиная с 2000 г. - регулярно один раз в два года, и является представительным научным форумом в области интеллектуального анализа данных, машинного обучения, распознавания образов, анализа изображений, обработки сигналов, дискретного анализа. Организационный комитет ИОИ-2018 выражает особую благодарность компаниям Форексис и ЦСПиР, оказавшим неоценимую помощь при подготовке и проведении конференции. Конференция поддержана грантом РФФИ 18-07-20075. Сайт конференции http://mmro.ru.
В статье обсуждаются различные способы оптимизации системы, моделирующей референциальный выбор (РВ) на основе аннотированного корпуса с использованием машинного обучения. Аннотационная схема, использовавшаяся в наших более ранних исследованиях, была улучшена и расширена. На следующем этапе был имплементирован более «дешевый» набор параметров с целью сокращения времени обработки и трудозатратности аннотации. Наши результаты свидетельствуют о том, что, несмотря на возможность исключения наиболее «дорогих» факторов при моделировании РВ, лучшая аккуратность предсказания достижима только при использовании максимального количества доступной информации. Жанровая принадлежность текстов была введена в систему в качестве одного из параметров и послу-жила повышению показателя аккуратности. И наконец, была запущена серия психолингвистических экспериментов по изучению категоричности выбора, совершаемого говорящими/пишущими. Первые полученные нами результаты оказались многообещающими: они показали, что в случаях, в которых системе не удается дать однозначное предсказание, согласно человеческой оценке, возможно с равной вероятность использование более одного референциального средства.
Статья посвящена обзору современных тематик и актуальных направлений компьютерной лингвистики на основе анализа материалов одной из конференции в этой области, а именно, 24-ой Международная конференция по компьютерной лингвистике Coling2012. В ней приводится анализ основных подходов и проблемных точек в таких традиционных областях автоматической обработки текста, как автоматический морфологический и синтаксический анализ, машинный перевод и др. Также подробно рассматриваются современные задачи автоматического извлечения информации из текста такие, как извлечение фактов, извлечения мнений, анализ контента на основе привлечения онтологических ресурсов Веба. Делается вывод о том, что для современного уровня развития компьютерной лингвистики характерно вовлечение все более сложных уровней лингвистического анализа в сферу автоматического анализа, применение гибридных подходов в решении задач компьютерной обработки текстов, совмещающих машинное обучение и алгоритмические методы. При этом уровни сложности современных задач обработки текстов, таких как извлечение временной референции в тексте, анализ структуры дискурса и многие другие, требуют активного привлечения экспертных лингвистических знаний.
Музыка – неотъемлемая часть немецкого духа, его составляющая, превратившаяся в общее место, в стереотип. Музыкальность – отличительная черта произведений Томаса Манна. По законом музыки строится композиция романа «Волшебная гора», в котором музыка выполняет системообразующую функцию как на уровне структуры, так и на уровне содержания, а также выступает в функции лейтмотива. При этом обращает на себя внимание двойственный, амбивалентный характер музыки. Музыка как бы разделяется на «высокую» и «низкую», при этом вторая разновидность музыки нередко не только не способствует преодолению хаоса и образованию системы, но, напротив, приводит к нарастанию хаоса, энтропии.
This book constitutes the refereed proceedings of the 12th Industrial Conference on Data Mining, ICDM 2012, held in Berlin, Germany in July 2012. The 22 revised full papers presented were carefully reviewed and selected from 97 submissions. The papers are organized in topical sections on data mining in medicine and biology; data mining for energy industry; data mining in traffic and logistic; data mining in telecommunication; data mining in engineering; theory in data mining; theory in data mining: clustering; theory in data mining: association rule mining and decision rule mining.
Журналы событий, сохраняемые современными информационными и техническими системами, как правило, содержат достаточно данных для автоматизированного восстановления моделей соответствующих процессов. Разработано множество алгоритмов для построения моделей процессов, проверки соответствия фактического поведения системы модельному, сравнения моделей процессов, и т.д. Однако возможность быстрого анализа выбираемых пользователями частей журнала до сих пор не нашла полноценной реализации. В статье описан метод многомерного хранения журналов событий для извлечения и анализа процессов, основанный на подходе ROLAP. Результатом анализа журнала является направленный невзвешенный граф, представляющий собою сумму возможных последовательностей событий, упорядоченных по вероятности их возникновения с учетом заданных условий. Разработанный инструмент позволяет выполнять совместный анализ моделей подпроцессов, восстановленных из частей журнала путем задания критериев отбора событий и требуемого уровня детализации модели.
Труды содержат доклады, представленные специалистами из России, Украины, Белорусии, Казахстана, Узбекистана, Германии, Великобритании, Польши по направлениям:«Радиационная физика металлов», «Радиационная физика неметаллических материалов», «Физические основы радиационной технологии» и посвященные разнообразным проблемам радиационной физики твердого тела (процессы прохождения заряженных и нейтральных частиц, рентгеновского и гамма-излучений через вещество, электрон-атомные, атом-атомные, ион-атомные и др. столкновения в твердых телах, ориентационные явления при взаимодействии высокоэнергетических частиц с твердым телом, радиационно-индуцированные и радиационно-стимулированные явления в твердых телах и др.).