№ 2 (107) февраль, 2023 г. Кинематические схемы механизмов параллельной Это достаточно общее определение, которое может структуры имеют классификацию по числу степеней упустить ряд важных факторов, когда речь идет о свободы выходного звена, но возможны и другие механизме реального устройства. Во-первых, суще- варианты. Степени свободы (DOF) в виде ственное влияние на рабочую область механизма механической системы является число независимых оказывают ограничения конструкции. Во-вторых, параметров, определяющих конфигурацию или со- распределение нагрузок на приводы является стояние. В справочнике [4] описана классификация непостоянным при различных положениях и этих механизмов на основе соответствия группам ориентациях рабочей области, вследствие чего суще- винтов, а также предложена классификация в соответ- ствуют области, в которых нагрузка на приводы ствии с типом связей, обладающих только поступа- больше допустимой, что приводит к существенной тельными степенями свободы [5]. потери точности позиционирования. Таким образом, функционирование реального манипулятора в неко- Два наиболее распространенных типа парал- торых областях становится недопустимым или даже лельных роботов – это стандартные параллельные невозможным, несмотря на то, что теоретически эти роботы и дельта-роботы. Стандартные параллельные области входят в рабочей области механизма [10]. роботы чаще упоминаются как: Для вычисления рабочей области используют гео- • робот-шестилапод; метрический, численные и дискретизации методы [1]. • параллельные манипуляторы; В данной работе численные методы не рассматри- • платформы Cтюарта [6]. ваются, так как их область применения ограничена Одной из важнейших задач исследований робо- вследствие сложности математического аппарата и тов с параллельным механизмом является, основные небольшим подклассом параллельных манипуля- задачи кинематики, прямая и обратная. Прямая торов. задача – это вычисление положения (X, Y, Z) рабочего органа манипулятора по его кинематической схеме Геометрический метод. Целью этого метода яв- и заданной ориентации (A1, A2… An) его звеньев ляется геометрическое определение границы рабочего (n - число степеней свободы манипулятора, A - углы пространства робота. Принцип состоит в том, чтобы поворота). Обратная задача - это вычисление углов вывести из ограничений на каждом отрезке геометри- (A1, A2… An) по заданному положению (X, Y, Z) ческий объект Wl, который описывает все возможные рабочего органа и известной схеме его кинематики. местоположения X, удовлетворяющие ограничениям Решение прямой задачи описывает нахождение отрезка. Один такой объект получается для каждой рабочего органа манипулятора при заданных углах конечности, и рабочее пространство робота состоит его звеньев, а обратная задача наоборот – какие пара- из пересечения всех Wl. метры необходимо задать звеньям манипулятору, чтобы его рабочий орган оказался в заданном Такой метод был использован J-P. Merlet положении [8]. припостроений робочей области для параллельного манипулятора 6 DOF [11]. В итоге использования Рабочая область. Прежде чем приступать к зада- метода получаем 6 областей, а рабочее пространство, чам прямой и обратной кинематики, с начала стоит является пересечением этих областей. Поэтому выбрать метод определения рабочей области. Рабочая граница рабочей области представляет собой список область робота – это совокупность всех положений, дуг окружности. На рисунке 1 показан пример (для которые он может достичь. Она зависит от ряда наглядности использовано только три области). факторов, включая размеры самого манипулятора. Рисунок 1. Жирной линией показана граница рабочей области, полученная в результате пересечения трех кольцевых областей [11] Этот же метод был использован для нахождения обеспечивает минимальное представление рабочего робочей области параллельного механизма 5-DOF и пространства, с помощью которого можно планарно-параллельный механизм 3-PRR [12,13]. эффективно рассчитать некоторые характеристики Основной интерес геометрического подхода заключа- рабочего пространства, например, его объем. ется в том, что он очень быстрый и точный, а также 50
№ 2 (107) февраль, 2023 г. Его недостатки заключаются в том, что он должен Метод дискретизации. В многочисленных рабо- быть адаптирован к рассматриваемому роботу, может тах, посвященных расчету рабочего пространства, быть будет трудно учесть все ограничения, а мини- используются методы, основанные на дискретизации мальное представление рабочего пространства может параметров позы для определения границы рабочего быть не самым подходящим для таких задач, как пространства. При таком подходе дискретизации рабо- планирование движения. Возможный упрощенный чее пространство покрывается регулярной сеткой подход заключается в вычислении только фрагментов узлов, либо картезианской, либо полярной. Каждый рабочей области и аппроксимации сечения Wl поли- узел затем проверяется на принадлежность к рабочему гонами. Этот подход требует хорошей библиотеки пространству. Граница рабочей области состоит из вычислительной геометрии, способной выполнять множества допустимых узлов, где хотя бы один логические операции, будь то пересечение, объеди- близкий сосед не принадлежит рабочей области. нение или различие, на полигонах с произвольным количеством ребер. Метод дискретизации использовался в работах над последовательными и параллельныеми манипуля- торами, параллельных роботах 3-RPS, дельта-роботах [14, 15, 16]. Рисунок 2. Дискретизация рабочего пространства [14] Преимущество этого метода в том, что он позво- Выводы. Для вычисления рабочей области были ляет учесть все ограничения. Но у этого подхода есть рассмотрены два метода: геометрические методы и некоторые недостатки: методы дискретизации. Выбор метода исследования робочей области робота зависит от поставленной • точность границы зависит от шага дискре- задачи и от самой конструкций робота. тизации, который используется для создания сетки, время вычислений растет экспоненциально с шагом Геометрические методы, достаточно быстрые и дискретизации, так что существует предел точности; точные в вычеслениях, они дают некоторое представ- ление о проблемах, таких как оптимальное проекти- • проблемы возникают, когда рабочее простран- рование и столкновения между звеньями, что является ство содержит пустоты; несомненным преимуществом на этапе проектиро- вания параллельного робота. Однако такой подход • представление границы может включать боль- не доступен для каждого робота. шое количество узлов; Методы дискретизации позволяют более удобно • граница используется для различных операций, работать с ограничениями, но точность пошаговых таких как определение объема рабочего пространства, тисков, огромное количество узлов и не легко включение траектории в рабочее пространство и т.д. расширяемых для использования при сравнении Когда эти операции выполняются на границе, пред- манипуляторов или анализе конструкции являются ставленной дискретным набором поз, они требуют некоторыми недостатками этого метода. больших вычислительных затрат. Список литературы: 1. Мерле J.P. (2008). Параллельные роботы, 2-е издание . Springer. ISBN 978-1-4020-4132-7. 2. Patel Y., and George P., 2012, “Parallel Manipulators Applications-A Survey,” Modern Mechanical Engineering, 2(3), pp. 57-64. 3. Zhang D., 2010, Parallel Robotic Machine Tools, Springer, New York. 4. Биргер И.А. Прочность, устойчивость, колебания. Справочник в трех томах. Т. 3 / И.А. Биргер, Я.Г. Пановко. – М.: Машиностроение, 1968. – 568 с. 51
№ 2 (107) февраль, 2023 г. 5. Глазунов В.А. Пространственные механизмы параллельной структуры / В.А. Глазунов, А.Ш. Колискор, А.Ф. Крайнев. – М.: Наука, 1991. – 95 с. 6. Parallel Robots: The High-Speed Robotics Platform. URL: https://howtorobot.com/expert-insight/parallel-robots (дата обращения: 16.12.2022). 7. Clavel R. (1991) Conception d’un robot parallèle rapide à 4 degrés de liberté. Ph.D. Thesis, EPFL, Lausanne, Switzerland. 8. Кинематика: прямая и обратная задачи. URL: https://robocraft.ru/mechanics/756 (дата обращения: 16.12.2022). 9. Хейло С.В., Глазунов В.А. Решение задачи об управлении поступательно-направляющим механизмом параллельной структуры. Справочник. Инженерный журнал, 2013, № 10, с. 17–24. 10. K.G. Erastova, P.A. Laryushkin Workspaces of Parallel Mechanisms and Methods of Determining Their Shape and Size, ИЗВЕСТИЯ ВЫСШИХ УЧЕБНЫХ ЗАВЕДЕНИЙ. МАШИНОСТРОЕНИЕ стр 78-87. 11. Merlet, Jean-Pierre. (1992). Geometrical determination of the workspace of a constrained parallel manipulator. 12. Farzanehkaloorazi, Mohammadhadi & Masouleh, Mehdi & Caro, Stéphane & Mashhadi Gholamali, Behnam. (2014). Determination of Maximal Singularity-Free Workspace of Parallel Mechanisms Using Constructive Geometric Approach. Mechanisms and Machine Science. 15. 10.1007/978-94-007-7214-4-34. 13. Masouleh, Mehdi & Gosselin, Clément & Saadatzi, Mohammad Hossein & Taghirad, Hamid. (2010). A Geometric Constructive Approach for the Workspace Analysis of Symmetrical 5-PRUR Parallel Mechanisms (3T2R). Proceedings of the ASME Design Engineering Technical Conference. 2. 10.1115/DETC2010-28509. 14. Ni Jinlu & Mei Jiangping & Hu Weizhong. (2021). A hierarchical approach for rigid-body dynamics model simplification of a high-speed parallel robot by considering kinematics performance. Science Progress. 104. 003685042110630. 10.1177/00368504211063072. 15. Jha Ranjan & Chablat Damien & Baron Luc. (2018). Influence of Design Parameters on the Singularities and Workspace of a 3-RPS Parallel Robot. 16. Castelli, Gianni & Ottaviano, Erika & Ceccarelli, Marco. (2008). A Fairly General Algorithm to Evaluate Workspace Characteristics of Serial and Parallel Manipulators. Mechanics Based Design of Structures and Machines – MECH BASED DES STRUCT MECH. 36. 14-33. 10.1080/15397730701729478. 52
№ 2 (107) февраль, 2023 г. ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И УПРАВЛЕНИЕ ПРИМЕНЕНИЕ ТЕОРИИ ГРАФОВ В СФЕРЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ Абгалдаева Алина Александровна магистрант, ФГБОУ ВО \"МГТУ \"СТАНКИН\", РФ, г. Москва E-mail: [email protected] Пушкин Алексей Юрьевич доц., канд. техн. наук кафедры информационных технологий и вычислительных систем, ФГБОУ ВО \"МГТУ \"СТАНКИН\", РФ, г. Москва E-mail: [email protected] APPLYING OF GRAPH THEORY IN INFORMATION TECHNOLOGY Alina Abgaldaeva Master student, Moscow State University of Technology \"STANKIN\", Russia, Moscow Alexey Pushkin Associate professor of the department information technologies and computer systems, Moscow State University of Technology \"STANKIN\", Russia, Moscow АННОТАЦИЯ В статье рассматривается применение теории графов в сфере информационных технологий и использование основных проблем теории графов в программировании. ABSTRACT The article considers the application of the graph theory in the sphere of information technologies and use of basic problems of graph theory in programming. Ключевые слова: теория графов, применение графов, использование основных проблем теории графов. Keywords: graph theory, the application of the graph theory, use of basic problems of graph theory in programming. ________________________________________________________________________________________________ Введение Кратко о теории графов Теория графов играет важную роль во многих Граф – это диаграмма состоящая из точек и ли- проблемах программирования. Репрезентация данных ний, соединяющих их, где точки обычно называют в виде графов используется во многих алгоритмах, вершиной графа, а линии, их соединяющие – ребрами к примеру в рандомизированных алгоритмов, алгорит- графа, при этом не существует вершины, соединяю- мов аппроксимации и нахождения кратчайшего пути. щей саму себя. Концепция теории графов строится на Еще теория графов играет важную роль в управле- таких основных понятиях, как вершина, ребро, степень нии памятью, вычислительной биологии, интернет- вершин и свойства графов. Дадим их определения. томографии. Стоит упомянуть и про социальные сети и многие другие сайты, алгоритмы рекомендаций Вершина графа – элемент (точка) графа, которая и общие механизмы работы которых опираются на обозначает объект любой природы, который входит в теорию графов. множество объектов, описываемое графом. Для боль- шего понимания вершины графа обычно именуют в алфавитном порядке, а изображаются в виде точек. __________________________ Библиографическое описание: Абгалдаева А.А., Пушкин А.Ю. ПРИМЕНЕНИЕ ТЕОРИИ ГРАФОВ В СФЕРЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ // Universum: технические науки : электрон. научн. журн. 2023. 2(107). URL: https://7universum.com/ru/tech/archive/item/15061
№ 2 (107) февраль, 2023 г. Ребро графа – это линия, соединяющая две вер- Степень вершины графа - количество ребер, шины графа. Одну вершину могут связывать множе- входящих или исходящих из вершины [4]. ство ребер. Ребро не может существовать без вершин, причем для ребра должны существовать начальная Инварианты - для применения теоретических и конечная вершины. На примере ниже изображен проблем теории графов в практических задачах, гра- граф с вершинами a и b и ребром, соединяющим их. фовые инварианты сопоставляются с реальными проблемами. Инварианты – это свойства графа, такие Рисунок 1. Пример простого графа как вершины, ребра, диаметр и степень [5]. Подграфы – это граф, вершины и ребра которого, являются подмножествами другого графа [6]. Случайные графы - это граф, свойства которого, такие как число вершин и ребер и связи между ними определены случайным образом [7]. Рисунок 2. Примеры случайных графов с 10 вершинами Примеры использования теории графов данных можно рассматривать как проецирование большого графа на небольшой выбранный граф. Теория графов нашла свое применение во многих Обратная задача построения графа из его проекций сферах информационных технологий, рассмотрим имеет приложения, среди прочего, в управлении наиболее классические примеры. памятью, вычислительной биологии и интернет- томографии [2]. 1. Социальные сети - где пользователя можно представить как вершину, а его подписки на другие Случайные графы – достигнутый прогресс в по- аккаунты и сообщества, отмеченных друзей на фото- нимании случайных графов, пороговых функций и графиях и в записях и прочие активности, как ребра, их поведении позволил ответить на вопросы вывода соединяющие его с другими пользователями [3]. одного свойства графа из другого, и, в частности, как можно управлять поведением графа с помощью 2. Навигаторы и интернет карты – различные его основных инвариантов. Ответы на такие основные места или текущее местоположение пользователя вопросы являются одними из основных инструментов можно представить как вершины графа, а соединяю- разработки и анализа рандомизированных алгорит- щие их дороги, как ребра графа. Благодаря такому мов и алгоритмов аппроксимации [2]. подходу реализуется алгоритм построения кратчай- шего пути [3]. Массивные графы – данные графы во многом схожи с разреженными случайными графами, но есть 3. Механизм рекомендаций на различных сайтах - и различия. Так реалистичные массивные графы слу- теория графов здесь используется для поиска объек- жат испытательным стендом для моделирования и тов, статей или событий, которые могут заинтересо- анализа графов [2]. вать пользователя, опираясь на его предыдущие дей- ствия. К примеру, последний просмотренный товар Комбинаторная оптимизация – это процесс в интернет магазине и товар их рекомендации – это нахождения оптимального решения путем оценки две вершины графа, а их схожие характеристики – конечного числа комбинаций, главным образом это ребро, которое их соединяет [3]. смоделированная теорией графов или линейным программирование [1]. Сегодня комбинаторная опти- Использование основных проблем мизация увеличивает влияние в значительной части теории графов в программировании проблем оптимизации, возникающих в электронной коммерции, планирования следующего поколения се- Инварианты графа действуют, как мост между тей, дизайн живучести и отказоустойчивости сетей [2]. наукой и инженерией как инструмент поддержки или вычислительные техники, особенно в области Заключение химии, электроники, компьютеров и телекоммуника- ционной инженерии [5]. В данной статье было рассмотрено применение теории графов и ее основных проблем в программи- Вложенные графы и массивы графов - суть про- ровании. А именно, где используется репрезентация блемы в том, как встроить один граф в другой с сохра- данных в виде графов и какие алгоритмы опираются нением расстояний и прочих инвариантов, при этом на нее. минимизировав степень вершины графа. Например, визуализацию и представление массивных наборов 54
№ 2 (107) февраль, 2023 г. Список литературы: 1. Baeldung: Combinatorial Optimization / [Электронный ресурс]. - Режим доступа: URL: https://www.baeldung.com/cs/combinatorial-optimization-problems-methods (дата обращения 31.01.2023). 2. Discrete Mathematics for Information Technology: сб. ст. for DMS workshop \"Intellecual Opportunities in the Mathematicl Sciences\" — Ирвин, 2000. — 300 c. https://mathweb.ucsd.edu/~fan/research/it2.html (дата обращения 31.01.2023). 3. GeeksforGeeks: A computer science portal for geeks / [Электронный ресурс]. - Режим доступа: URL: https://www.geeksforgeeks.org/mathematics-graph-theory-basics-set-1/ (дата обращения 31.01.2023). 4. Graph Online: Степень вершин / [Электронный ресурс]. – Режим доступа: URL: https://graphonline.ru/wiki/%D0%A1%D0%BF%D1%80%D0%B0%D0%B2%D0%BA%D0%B0/%D0%A0%D0 %B0%D1%81%D1%87%D0%B5%D1%82%D0%A1%D1%82%D0%B5%D0%BF%D0%B5%D0%BD%D0%B8 %D0%92%D0%B5%D1%80%D1%88%D0%B8%D0%BD (дата обращения 31.01.2023). 5. Hindawi: Mathematical Problems in Engineering / [Электронный ресурс]. - Режим доступа: URL: https://www.hindawi.com/journals/mpe/si/954839/ (дата обращения 31.01.2023). 6. NIST: National Institute of Standards and Technology / [Электронный ресурс]. - Режим доступа: URL: https://xlinux.nist.gov/dads/HTML/subgraph.html#:~:text=(definition),are%20subsets%20of%20another%20graph (дата обращения 31.01.2023). 7. Wolfram MathWorld: the web’'s most extensive mathematics resource / [Электронный ресурс]. – Режим доступа: URL: https://mathworld.wolfram.com/RandomGraph.html#:~:text=A%20random%20graph%20is%20a,edge%20prob- abilities%20distributed%20uniformly%20in%20 (дата обращения 31.01.2023). 55
№ 2 (107) февраль, 2023 г. ВОЗМОЖНОСТИ И ПРОБЛЕМЫ ОЦИФРОВКИ БИБЛИОТЕЧНЫХ РЕСУРСОВ УНИВЕРСИТЕТСКИХ БИБЛИОТЕК Атаева Гульсина Исроиловна ст. преподаватель, Бухарский государственный университет, Республика Узбекистан, г. Бухара E-mail: [email protected] Бозоров Дилшод Савриддин угли магистрант, направление образования «Компьютерные науки и технологии программирования», Бухарский государственный университет, Республика Узбекистан, г. Бухара E-mail: [email protected] OPPORTUNITIES AND PROBLEMS OF DIGITIZATION OF LIBRARY RESOURCES OF UNIVERSITY LIBRARIES Gulsina Ataeva Isroilovna senior lecturer, Bukhara State University, Republic of Uzbekistan, Bukhara Dilshod Bozorov Мaster's student, direction of education \"Computer science and programming technologies\", Bukhara State University, Republic of Uzbekistan, Bukhara АННОТАЦИЯ Современные университетские библиотеки невозможно представить без цифрового контента, особенно это важно для университетских библиотек. Поэтому в современных библиотеках оцифровка занимает важное место в процессе работы библиотекарей. Оцифровка, т.е преобразование нецифрового материала в цифровой, открывает новые возможности как для библиотечных услуг, так и для читателей, поэтому в Узбекистане активно ведётся политика внедрения цифровых технологий в работу библиотек. Создание цифровой библиотеки – сложный процесс и требует особого внимания со стороны руководства для обеспечения осуществления данного проекта. Почему же так важна оцифровка в университетских библиотеках? Оцифровка позволяет сохранять библиотечные ресурсы, находящиеся под угрозой исчезновения, повышает эффективность механизмов поиска информации и расширяет доступ к библиотечным ресурсам. ABSTRACT Modern university libraries cannot be imagined without digital content, this is especially important for university libraries. Therefore, in modern libraries, digitization occupies an important place in the process of librarians' work. Digitization, i.e. the transformation of non-digital material into digital, opens up new opportunities for both library services and readers, therefore, Uzbekistan is actively pursuing a policy of introducing digital technologies into the work of libraries. The creation of a digital library is a complex process and requires special attention from management to ensure the implementation of this project. Why is digitization in university libraries so important? Digitization makes it possible to preserve library resources that are in danger of extinction, increases the efficiency of information retrieval mechanisms and expands access to library resources. Ключевые слова: оцифровка, цифровой контент, библиотечный архив, работа персонала, поиск информации. Keywords: digitization, digital content, library archive, staff work, information search. ________________________________________________________________________________________________ Введение сохраняя интеллектуальную информацию универси- тета. Интеграция цифровых технологий в деятельность В последние годы университеты Узбекистана университетских библиотек, служит инструментом широко внедряют использование цифровых техноло- совершенствования и развития услуг библиотеки. гий в свою деятельность, так как библиотеки являются лицом любого научно-образовательного учреждения, __________________________ Библиографическое описание: Атаева Г.И., Бозоров Д.С. ВОЗМОЖНОСТИ И ПРОБЛЕМЫ ОЦИФРОВКИ БИБЛИОТЕЧНЫХ РЕСУРСОВ УНИВЕРСИТЕТСКИХ БИБЛИОТЕК // Universum: технические науки : электрон. научн. журн. 2023. 2(107). URL: https://7universum.com/ru/tech/archive/item/14949
№ 2 (107) февраль, 2023 г. Все университетские библиотеки Узбекистана пандемии COVID 2019. Также это обеспечивает являются центром информационных ресурсов, что доступ к книгам сторонних пользователей, которым обязывает каждую из университетских библиотек могут предоставляться платные услуги. При этом иметь свой собственный репозиторий, предназначен- пополняется бюджет библиотеки. ный для сбора и хранения оцифрованной интеллек- туальной собственности университета (магистерские, • повторное использование электронных ресур- кандидатские диссертации, авторефераты научных сов в первую очередь означает, что оригинал книги работ, важные научные статьи и книги сотрудников может сохраняться долгое время, сколько нужно. университета и т.п.), а также служить для сохранения Также это обеспечивает одновременный доступ оцифрованной раритетной литературы и обычно нескольких пользователей к ресурсу, необходимо доступен для всех. только обеспечить высокоскоростной интернет. Что же представляет собой оцифровка информа- Как мы уже говорили, оцифровка библиотечного ции? По мнению многих исследователей, оцифровка – фонда процесс довольно сложный, который требует это преобразование любой аналоговой информации, затрат временных, технических, материальных и включая информацию на бумажном носителе в элек- человеческих ресурсов. Академические библиотеки тронную (цифровую) информацию, с целью её сохра- оцифровывают материалы, потому что знают о по- нения на электронных носителях, а также на сетевых стоянной ценности библиотечных ресурсов для серверах. обучения, преподавания, научных исследований, документации и публичной отчетности. Основная часть При проведении цифровизации фонда библио- Цифровизацию библиотек позволяют осуществ- теки, следует учитывать следующие моменты: лять специальные программные продукты, которые создаются специально для оцифровки бумажных но- • Необходима ли оцифровка материала? Если до- сителей информации. Для цифровых ресурсов особо кументы, которые необходимо оцифровать содержат важное место занимает глобальная компьютерная ценную информацию, которая ещё долго не устареет сеть, позволяющая осуществлять доступ к информа- и если документ уникален, то да оцифровка необхо- ционным ресурсам университетских библиотек. дима. Если же материалы безнадёжно устарели и ими Многие из современных ресурсов появляются на свет никто не пользуется, то смысла в оцифровке нет. уже оцифрованными и тоже хранятся в цифровых репозитариях университетских библиотек. Таким • Какая литература пользуется наибольшим образом цифровизация библиотек осуществила ренес- спросом? Такие книги необходимо оцифровать в санс библиотечного дела в новом формате, позволяя первую очередь, чтобы обеспечить потребность получить нужную информацию в удобном для чита- читателей. телей формате. • Оцифрованные документы должны быть Давайте рассмотрим причины, которые требуют упорядочены по определённой тематике, чтобы оцифровки ресурсов библиотек, их несколько: в совре- пользователи с лёгкостью могли находить нужные менных библиотеках с целью экономии сокращается электронные ресурсы в электронных каталогах. бюджет на обновление библиотечного фонда; популя- ризация электронной информации; желание получить • Возможности оцифровки документов. Оциф- удалённый доступ к материалам других библиотек; ровку можно производить, создавая текстовые доку- приобретение возможностей совместного использова- менты с возможностью поиска, а также создавать ния ресурсов академических библиотек; рост стоимо- документы изображения. Персонал, осуществляю- сти сохранения бумажных носителей в библиотеках; щий оцифровку материалов, должен принимать возможности пополнения фондов библиотек новей- правильное решение – какой файл лучше создать, шей литературой в электронном формате. чтобы не повредить оригинальный документ. Т.е. если документы слишком ветхие, их лучше сохранить в При изучении проблемы явно определились виде изображений. Современные цифровые техно- потребности, которым удовлетворяет оцифровка логии оптического распознавания символов (OCR) библиотечных ресурсов: сохранность книжного позволяют преобразовывать файлы изображений, фонда; обеспечение доступа к документам библио- в текстовые файлы с возможностью поиска. течного фонда и возможность повторного использова- ния материалов, не боясь износа литературного фонда. • Существование цифровой копии оригиналь- ного документа в свободном доступе. Если такой • сохранность книжного фонда университетской документ существует, то нет необходимости делать библиотеки означает, что можно сохранить: ценные это ещё раз. экземпляры книг; различные авторские проекты, раз- работанные учащимися и сотрудниками университета; • Наличие подготовленного персонала. Перед нормативные документы, необходимые для научной оцифровкой документа следует его хорошо обсле- деятельности. Следует заметить, что заменив ценные довать, чтобы не повредить его, очистить от пыли экземпляры на цифровой эквивалент, необходимо и посторонних предметов. Также персонал должен продолжать сохранение первоисточника. умело обращаться со сканирующей техникой, т.е. пройти специальную подготовку. Ещё один момент, • обеспечение доступа означает, что возможно на который следует обратить внимание, это сравнение отсутствие физического контакта между читателями отсканированного документа с оригиналом. Этот и библиотекарем, особенно это необходимым в период процесс требует особого внимания и усидчивости работников библиотеки, иначе оригинальные данные могут затеряться в процессе сканирования. 57
№ 2 (107) февраль, 2023 г. В современных библиотеках особое место SMART электронный библиотечный каталог. Ме- занимает электронный каталог – совокупность про- таданные – это информация, которая описывает граммных и аппаратных средств по обеспечению цифровые объекты и позволяет пользователям нахо- деятельности библиотеки по заказу, каталогизации, дить, управлять и использовать цифровые объекты. поиску. Первые электронные библиотечные каталоги Они представляет собой полное описание цифрового появились в библиотеках США в 1970 году, их по- объекта. Метаданные помогают идентифицировать явление было обусловлено внедрением вычисли- произведение: кто его создал, перенес или переформа- тельной техники в работу библиотек. тировал, а также другую описывающую информацию; они предоставляют уникальную идентифицирующую При изучении работы библиотеки Бухарского информацию об организации, файлах и базах данных, государственного университета были рассмотрены которые содержат подробную информацию о циф- реквизиты книг, которые отражаются в электронном ровом содержимом; описывает техническую среду, каталоге библиотеки, который позволяет осуществ- в которой были созданы цифровые файлы, о том какое лять поиск литературы. В списке каталога имеются оборудование было использовано при оцифровке, все книги библиотечного фонда, включая электронные программное обеспечение, операционные системы ресурсы, в него также вносятся новые поступления и прочее. книг, газетные издания, научные журналы, авторе- фераты, кандидатские и докторские диссертации. Заключение В каталог внесены стандартные для всех биб- Заключая вышесказанное нужно отметить, что с лиотек реквизиты, на сегодняшний день ведутся появлением оцифрованных материалов библиотек программная разработка магистрантов в рамках (ещё в 1971 году в США) в библиотечном деле магистерской диссертации, которая обеспечит по- наступила новая эра, а сегодня это новейшая эра с иск нужного ресурса по его изображению или по использованием программ ORC, метаданных и аудиозапросу, также в каталог вносится аннотация широкополосным интернетом. Оцифровка библиотеч- (метаданные) литературы, позволяющая обеспечить ных материалов веление времени, продиктованное метапоиск нужного материала, так называемый развитием информационных технологий. Список литературы: 1. Атаева Г.И., Бозоров Д.С. Управление знаниями в библиотеках // ВЫСШЕЕ ТЕХНИЧЕСКОЕ ОБРАЗОВАНИЕ: ПРОБЛЕМЫ И ПУТИ РАЗВИТИЯ. Материалы XI Международной научно-методической конференции. Минск, 24 ноября 2022 года. С. 5-10. 2. Дея М., Рак Д., и Белл Б. (2021). Готовность к цифровой трансформации: перспективы академических кругов и библиотечных результатов в области информационной грамотности// Журнал академического библиотечного дела, 47 (5), 102403. 3. Тахиров Б.Н., Бозоров Д.С. Цифровой прогресс как ключевой фактор улучшения качества жизни // Между- народная научная конференция «Качество жизни населения промышленных территорией в стратегии «обще- ство 5.0». Том 1, г. Набережные Челны, 2022. С. 84-86. 4. Обиора Кингсли Удем. (2015) Оцифровка библиотечных ресурсов в университетских библиотеках: практи- ческий подход, проблемы и перспективы. // Madonna University Journal of Research in Library and Information Science, Vol. 3 No. 2, 2015. 58
№ 2 (107) февраль, 2023 г. ПРОБЛЕМА ИССЛЕДОВАНИЯ АССОЦИАТИВНОСТИ В DATA MINING Гаджиев Фаик Гасан оглы канд. техн наук, доц. Азербайджанского Государственного Университета Нефти и Промышленности, Республика Азербайджан, г. Баку E-mail: [email protected] Керимов Вагиф Асад оглы канд. техн наук, доц. Азербайджанского Государственного Университета Нефти и Промышленности, Республика Азербайджан, г. Баку E-mail: [email protected] THE PROBLEM OF ASSOCIATIVITY RESEARCH IN DATA MINING Faiq Hajiyev Cand. of Sciences, Associate Professor, Azerbaijan State Oil and Industry University, Azerbaijan, Baku Vagif Karimov Cand. of Sciences, Associate Professor Azerbaijan State Oil and Industry University, Azerbaijan, Baku АННОТАЦИЯ Рассматривается проблема обобщения на отношениях баз знаний экспертных систем, что вытекает из прагматических представлений относительно получения новых закономерностей, а следовательно поддержки актуальности системы. В то же время задачи обобщения по признакам имеют определённое значение в технологии Data Mining относительно необходимости эффективных средств исследования в нечётком кластерном анализе и ассоциативных отношений. ABSTRACT The problem of generalization on the relations of knowledge bases of expert systems is considered, which follows from the pragmatic representations concerning the obtaining of new patterns, and hence supporting the relevance of the system. At the same time, the task of generalization by features has a certain importance in Data Mining technology regarding the need for effective means of research in fuzzy cluster analysis and associative relations. Ключевые слова: Ассоциативные отношения, кластерный анализ, Data Mining, экспертные системы, база знаний. Keywords: Associative relationships, cluster analysis, Data Mining, expert systems, knowledge base. ________________________________________________________________________________________________ Введение. Исследования в области искусствен- При анализе данных в Data Mining представле- ного интеллекта, ориентированные на современные ние исходного пространства совокупностью схожих подходы к решению задач показывают, что осознание между собой по какому-либо признаку объектов в важности использования знаний проблемной области значительной степени обеспечивает эффективность оказывает стремительное влияние на технологию их стратегии обработки, что имеет важное значение при представления и выявления, в связи с чем примене- анализе и прогнозировании различных процессов, ние нейронных сетей, распознавания образов и т.д. связанных с многомерностью их описания и пред- приобрели особое значение уже в рамках новой полагающих использование в том числе методов технологии интеллектуального анализа данных указанного ресурса. Методы кластерного анализа в (Data Mining). Они предполагают выявление неиз- Data Mining тесно связаны с задачей выявления ассо- вестных ранее знаний, характеризующихся нетриви- циативных правил, предусматривающих определение альностью и новых закономерностей в структурах зависимостей относительно связанных объектов, данных, практическое значение которых не подлежит обеспечивающих распознавание существующих шаб- сомнению. лонов с целью оценки сущности ситуаций в анализи- руемой проблемной области. __________________________ Библиографическое описание: Гаджиев Ф.Г., Керимов В.А. ПРОБЛЕМА ИССЛЕДОВАНИЯ АССОЦИАТИВНОСТИ В DATA MINING // Universum: технические науки : электрон. научн. журн. 2023. 2(107). URL: https://7universum.com/ru/tech/archive/item/14971
№ 2 (107) февраль, 2023 г. Постановка задачи. Проблема нечёткой класте- Аналогичным образом, если ������������: ������ ∗ ������ → [0,1] − ризации часто рассматривается на основе методов функция принадлежности нечёткого бинарного от- эвристического, иерархического и оптимизационного ношения S, а ������������(������, ������) - степень принадлежности Z к Y подходов, среди которых особое значение придаётся последнему направлению, ориентированному на ������1 ������2 . . . . . . . . ������������ разбиение ������ ∗ (������) = {������1, … , ������������} на заданное число нечетких кластеров с учётом некоторого критерия ������1 ������������(������1, ������1) ������������(������1, ������2). . . . . ������������(������1, ������������) ������.2 качества ������(������(������)).При этом указанным кластерам ������ = . ������������(������2. , ������1) ������������(������2, ���.���2). . . . . ������������(������2. , ������������) ... соответствуют функции принадлежности ������������������ , где ������������ [������������(������������, ������1) ������������(������������, ������2). . . . .������������(������������, ������������)] ������ = 1, … , ������; ������ = 1, … , ������ относительно изучаемых объектов ������ = {������1, … , ������������}, а в общем, случае задача Получаем: нечёткой кластеризации представляется в плоскости ������1 ������2 . . . . . . . . ������������ определения экстремума целевой функции ������(������(������)) ������1 ������������1(������1, ������1) ������������2(������1, ������2). . . . . ������������������(������1, ������������) в соответствии с соотношением ������(������(������)) → ������ = ������.2 ������������1(������.2, ������1) ������������2(������2., ������2). . . . ������������������(������.2, ������������) , ������������������������, ������(������) ∈ ������, где L- есть совокупность классов .. объектов X с учётом неотрицательности функций . . принадлежности и условий нормировки [1]. ������������ [������������1(������������, ������1) ������������2(������������, ������2). . . . .������������������(������������, ������������)] В то же время исследования показывают, что где указанный критерий качества обычно представляется функцией от множества исходных компонент с мно- ������������������ (������������ , ������������ ) = ∑������ ������������(������, ������) ∗ ������������(������, ������) жеством локальных экстремумов в связи с чем опреде- ∑������ ������������(������, ������) ление кластеров тесно связано с решением проблемы определения оптимальной кластеризации, когда число ∀������ ∈ ������, ������ ∈ ������, ������ ∈ ������. вариантов представления N объектов в виде K групп определяется соотношением: ������(������, ������) = 1 ������ ������ (������ − ������)������ Поскольку последняя функция является выпук- ������! ( ������ ) лой, то ∑(−1)������ ������=1 ������������������[������(������1, ������������) + (1 − ������)(������2, ������������)] ≥ ������������������ [������������������(������1, ������������), ������������������(������2, ������������)] Из этого следует, что сложность алгоритма перебора экспоненциально от её размерности, причём ∀������1 и ������2, ������������ ∈ ������ и ������ ∈ [0,1], как и все ������������������(������1, ������������) отсутствие информации о числе групп значительно и их пересечения, а следовательно осложняет указанную задачу. Следует иметь в виду, что традиционные методы кластеризации ориенти- ������������1(������1, ������1) ∧ ������������2(������1, ������2). . . . . ������������������(������1, ������������) рованы на направленный поиск, в определённой ������ = ������������1(������2., ������1) ∧ ������������2(������2., ������2). . . . ������������������(������.2, ������������) , степени, ограниченном признаковом пространстве, когда активизируются определённые ограничения . .. на её характеристики, но, в то же время, это не всегда [������������1(������������, ������1) ∧ ������������2(������������, ������2). . . . .������������������(������������, ������������)] приводит к обеспечению требуемой оптимальности решения, что предполагает использование более Сегментацию заданного признакового простран- развитых средств, существующих в искусственном ства можно реализовать с учётом ограничения интеллекте [2]. Методы решений. На основе приведённых сооб- ������ < min ������������������ ������������������ [������������������ (������, ������������ ), ������������������ (������, ������������ )] ражений и с учётом переобозначения исходных характеристик в соответствии с рассматриваемым ������ ������ контекстом предположим, что ������ = {������1, … , ������������}- мно- и уровневого множества жество объектов исходного пространства признаков , ������������ = {������/������������������(������) ≥ ������ = {������1, … , ������������}- множество признаков свойств объек- тов, ������ = {������1, . . . , ������������} – множество свойств объектов, min max ������������������ [������������������ (������, ������������ ), ������������������ (������ , ������������ )]}, ∀������ ∈ ������������ , ������������: ������ ∗ ������ → [0,1] − функция принадлежности нечёт- кого бинарного отношения R , ������������(������, ������) − степень ������ ������ ������ важности y по оценке x при определении предпочте- нья z . где под ������������ могут пониматься полученные сег- менты [3]. Тогда ������1 ������2 . . . . . . . . ������������ Алгоритм формирования ассоциативных отно- шений объектов исходного пространства признаков ������1 ������������(������1, ������1) ������������(������1, ������2) … . . ������������(������1, ������������) может быть представлен в следующем виде. ������ = ������.2 ������������(������2. , ������1) ������������(������2, ���.���2) … . .������������(������2. , ������������) 1. Активизации базы данных. .. . . 2. Выбор свойства, относительно, которой будет ������������ [������������(������������, ������1) ������������(������������, ������2) … . .������������(������������, ������������)] производиться сегментация признакового простран- ства. 3. Загрузка признаков свойства. 60
№ 2 (107) февраль, 2023 г. 4. Для каждого из признаков специальным обра- 5. KУ записывается в исходную матрицу R с зом вычисляется коэффициент уверенности (КУ). элементами ������������(������, ������) С этой целью: 6. Создаётся матрица S, причём если i=j, то эле- a. По статистическому методу на отрезке опреде- мент ������������(������������, ������������) = 1, в противном случае ������������(������������, ������������) = 0. лённой длины вычисляются значения {������������} (������ = ̅1̅,̅5̅) терм – множества лингвистической переменной 7. Определение матрицы T, элементы, которой «число». Системные значения относительно первого функции принадлежности ������������������(������, ������������). свойства – 100, для второго-200; 8. Определение значений элементов матрицы W. b. Начиная с центра ������5 и правых, то есть больших 9. Вычисление порога разделения l. значений лингвистической переменной произведём 10. Формирование ассоциативных отношений последовательные присваивания степеням принад- исходного пространства. лежности - единицы. Степени принадлежности остальных элементов универсума, соответствующие Выводы. В результате проведённых исследова- интервалу [0,1] вычисляются делением на центральное ний разработан подход, ориентированный на фор- мирование ассоциативных отношений исследуемого значение ������5 всех меньших от него чисел. пространства признаков, что позволяет говорить о его сегментации. Список литературы: 1. Вятченин Д.А. Методология анализа данных, основанная на многоэтапной нечеткой кластеризации Искусственный интеллект,2009, N 3, c. 33-46. 2. Леунг Й. Разделение на торговые зоны в нечетких условиях. В кн.: нечёткие множества и теория возможностей. Последние достижения. Под ред. Р.Ягеря, М.,Радио и связь,1986, с. 339-349. 61
№ 2 (107) февраль, 2023 г. АЛГОРИТМ ПРИНЯТИЯ РЕШЕНИЯ ДЛЯ ОДНОЙ МНОГОКРИТЕРИАЛЬНОЙ ЗАДАЧИ С МАТРИЧНОЙ МОДЕЛЬЮ Керимов Вагиф Асад оглы канд. техн наук, доц. Азербайджанского Государственного Университета Нефти и Промышленности, Республика Азербайджан, г. Баку E-mail: [email protected] Гаджиев Фаик Гасан оглы канд. техн наук, доц. Азербайджанского Государственного Университета Нефти и Промышленности, Республика Азербайджан, г. Баку E-mail: [email protected] DECISION-MAKING ALGORITHM FOR ONE MULTICRITERIA PROBLEM WITH A MATRIX MODEL Vagif Karimov Cand. of Sciences, Associate Professor Azerbaijan State Oil and Industry University, Azerbaijan, Baku Faiq Hajiyev Cand. of Sciences, Associate Professor, Azerbaijan State Oil and Industry University, Azerbaijan, Baku АННОТАЦИЯ При анализе ряда задач по принятию решений можно встречаться с проблемой многокритериальности. Для решения соответствующей оптимизационной задачи, характеризующейся матрицей выигрыша и многокритериаль- ностью, разработан подход, реализуемый последовательно – на первом этапе выполняются вычисления на основе данных матрицы выигрышей, на втором этапе – на основе экспертной информации, строится новый обобщенный критерий оптимизации. Данный подход предполагает и учитывает выполнение вычислений в интерактивном режиме. ABSTRACT When analyzing a number of decision-making tasks, one may encounter the problem of multi-criteria. To solve the corresponding optimization problem determined by the payoff matrix and characterized by multicriteria, an approach was developed that is implemented sequentially: at the first stage, calculations are performed based on the data of the payoff matrix, at the second stage, based on expert information, a new generalized optimization criterion is constructed. This approach assumes and takes into account the execution of calculations in an interactive mode. Ключевые слова: Матричная модель задачи, многокритериальность, лицо принимающее решение, пессими- стический критерий, оптимистический критерий, Критерий Гурвица, Критерий Байеса-Лапласа, Критерий Севиджа. Keywords: Matrix model of the problem, multicriteria decision maker, pessimistic criterion, optimistic criterion, Hurwitz criterion, Bayes-Laplace criterion, Savage criterion. ________________________________________________________________________________________________ Введение. При решении ряда практических задач разным строкам этой матрицы. Пусть, aij (i= 1,2,..., n; лицо, принимающее решение, сталкивается с пробле- мой многокритериальности, что требует разработки j=1,2,...,m) сумма выигрыша человека при выборе и применения системного подхода к решению и ана- лизу проблемы [4]. Пусть, лицо принимающее реше- им стратегии с номером i, если при этом стратегия ние (ЛПР) должен выбрать некоторое решение, если рассматриваемая система описывается некоторой противника будет соответствовать столбцу матрицы матрицей. Разные решения (стратегии) соответствуют с номером j. Применяются следующие критерии оп- тимальности: пессимистический: J1= max min aij ; i j оптимистический: J2= max max aij ; Гурвица: ij __________________________ Библиографическое описание: Керимов В.А., Гаджиев Ф.Г. АЛГОРИТМ ПРИНЯТИЯ РЕШЕНИЯ ДЛЯ ОДНОЙ МНОГОКРИТЕРИАЛЬНОЙ ЗАДАЧИ С МАТРИЧНОЙ МОДЕЛЬЮ // Universum: технические науки : электрон. научн. журн. 2023. 2(107). URL: https://7universum.com/ru/tech/archive/item/14972
№ 2 (107) февраль, 2023 г. J3 = max min aij + (1 − ) max aij , где ������ ∈ решение «какая стратегия является оптимальной?». i j j Каждый критерий позволяет построить собственное j оптимальное решение. В этом случае требуется реа- лизовать многокритериальный подход для поиска [0,1] и показывает какой из слагаемых является важ- оптимальной стратегии ������������, где i – номер оптимальной нейшей при критерии J3: если ������ = 0,5, то они равно- стратегии [2]. значны, если ������ > 0,5, важнейшим считается первый, при ������ < 0,5 – второй; критерий Байеса-Лапласа : Метод решения. Алгоритм предусматривает пошаговое сокращение стратегий и, если надо, выяв- J 4= 1 m критерий Севиджа: ление одной стратегии. max m j =1 aij ; i Шаг1. Сокращение стратегий по матрице ‖������������������‖, если останется одна стратегия, она считается опти- ( )J5= − , определяет оптималь- мальной, иначе – на следующий шаг. На данном max min aij max aij шаге по значениям параметров aij из матрицы сни- i j i маются не перспективные стратегии. Множество не- ное решение на основе матрицы сожаления. перспективных стратегий обозначим 1 : Постановка задачи. Таблица 1 отражает матрицу выигрыша по которой человек должен принимать 1 = vi0 aio j ai1 j , 1 io n;1 i1 n; io i1, j = 1,4 . В множество 1 принадлежат стратегии, примеру находим: 1 = v2, v3 , v8 , и в результате описываемые строкой i0, у которой все показатели «не лучше» соответствующих показателей некоторой получаем: стратегии с номером i1 . Если множество 1 не пусто, = v1 , v4 , v5 , v6 , v7 , v9 , v10 . то мы имеем возможность сузить множество Шаг 2. Если имеется стратегия превосходящая других по большему числу критериев, то считается = v1,..., vn : = \\ 1 . По заданному оптимальной, иначе - на следующий шаг. Таблица 1. Информация о стратегиях ЛПР и его противника Альтернативные стратегии Альтернативные противника: Показатели стратегии ЛПР j=1,2,3,4 для принятия 7 8 9 решений: i=1,…,10 1 2 3 5 6 0,5(min aij 14 mjin(aij − j 4 min aij max aij 4 aij 1 j4 1 j4 + max aij ) j =1 − max aij ) j i 28 1 8 2 28 8 2 16 15 11,5 -20 2 10 6 16 14 6 18 11,5 3 16 10 6 18 6 26 11 12,5 -16 4 8 8 12 26 8 22 13,5 5 10 12 22 20 10 22 12 16 -22 6 16 22 18 2 2 20 14,5 7 18 12 12 20 12 18 17 15,5 -16 8 14 18 4 18 4 18 16 13,5 9 4 10 14 18 4 22 12 11,5 -10 10 16 22 6 22 6 16 16,5 J2= 28 -24 max aij -16 i =1,10 11 -24 11 -14 14 -22 18 22 28 26 J1= 12 J3= 17 J4= 16,5 J5= -10 63
№ 2 (107) февраль, 2023 г. Шаг 3. Если имеется стратегия, которая ни по критерию не становились оптимальными, поэтому одному критерию не является оптимальной, то ее снимать с рассмотрения. множество 2 определяется так: 2 ={ v6 , v9 }. Стратегия v1 является «лучше» других по крите- Выполняя сужение множества = \\ 2 в ре- рию J2, cтратегия v4 «лучше» по критерию J3, cтра- зультате получаем все стратегии, которые хотя бы по тегия v5 «лучше» по критерию J5 , стратегия v7 одному критерию «лучше» : Ω= v1,v4 ,v5,v7 ,v10 . «лучше» по критерию J1 , стратегия v10 «лучше» Шаг 4. Критерии считаются одинаково важными и предпочтительной считается стратегия, превосходя- по критерию J 4 . Таким образом, ������6, ������9 ни по какому щая других по cуммарному показателю: 1 4 4 aij + j =1 ( ) ������������������������ min aij + max aij + min aij + 1− max aij + mjin(aij − max aij ) . j j i 1 j4 1 j4 j Для удобства вычислений принимаем ������ = 0,5 и получим : J6=������������������������ 1 4 − min aij + max aij + 4 + mjin(aij max aij ) . aij i 1 j4 1 j4 j =1 Вычисления показывают: J6= max 21,5(по для которой показатель ������1 min aij +������2 max aij i 1 j4 1 j4 1-й строке);31,5(по 4-й строке); 38(по 5-й строке); 31,5 (по 7-й строке) ; 22,5(по 10-й строке)}=38. 4 +������3 По суммарному критерию J6 оптимальной оказа- 0,5( min aij + max aij ) +0,25������4 aij + лась 5 –я стратегия. j j j =1 Шаг 5. Ecли оптимальное решение не найдено, перейти на рассмотрение активной фазы алгоритма ������5 mjin(aij − max aij ) достигает максимума. Однако решения [1]. Данный этап предусматривает принятия i участия экспертов для оценки весовых коэффици- ентов ������������ показателей в столбцах 5-9 заданной таб- данный показатель можно упростить и в резуль- лицы [3]. Оптимальной будет считаться стратегия, тате получить критерий оптимальности: 4 − J7 = max ������1 min aij +������2 max aij +0,25������3 aij +������4 mjin(aij max aij ) }. i i 1 j4 1 j4 j =1 Для оценки коэффициентов ������������ экспертам Очевидно, что при этом будет выполняться: ������������ ∈ предоставляется анкета, в которой отражается ин- [0,1], ∑ ������������ =1. формация о важности (по их мнению) показателей таблицы. Допустим, в опросе участвуют m экспертов, Выводы. В результате проведённых исследова- для оценки важности р коэффициентов. Экспертам ний разработан подход, который предусматривает предлагается оценить важности показателей натураль- пошаговое сокращение альтернативных стратегий ными числами по возрастанию 1,2,...,р. В результате для построения оптимальных. При необходимости проведенного опроса строится некоторая матрица построения одной оптимальной стратегии преду- сматривается дополнительная информация в виде ij , где i=1,...,p; j=1,...,m; 1 ij p. Тогда коэффи- экспертных оценок о важности стратегий. циент показателя с номером i вычисляется по формуле: m ij j=1 . i= p m ij i=1 j=1 64
№ 2 (107) февраль, 2023 г. Список литературы: 1. Авинаш Диксит, Сьюзан Скит, Дэвид Рейли. Стратегические игры. Москва, Издательство «Манн, Иванов и Фербер», 2017 . — 880 с. ISBN 978-5-00100-813-2. 2. Андрианова А.А., Хабибуллин Р.Ф. Принятие решений в условиях неопределенности, Учебно-методическое пособие, Казань – 2015, 25 с. 3. Анохин А.Н. Методы экспентных оценок. Учебное пособие. – Обнинск: ИАТЭ, 1996.-148 с. 4. Лотов А.В., Поспелова И.И. Конспект лекций по теории и методам многокритериальной оптимизации. Учебное пособие. Москва, 2014, 127 с. 65
ДЛЯ ЗАМЕТОК
ДЛЯ ЗАМЕТОК
Научный журнал UNIVERSUM: ТЕХНИЧЕСКИЕ НАУКИ № 2(107) Февраль 2023 Часть 1 Свидетельство о регистрации СМИ: ЭЛ № ФС 77 – 54434 от 17.06.2013 Издательство «МЦНО» 123098, г. Москва, улица Маршала Василевского, дом 5, корпус 1, к. 74 E-mail: [email protected] www.7universum.com Отпечатано в полном соответствии с качеством предоставленного оригинал-макета в типографии «Allprint» 630004, г. Новосибирск, Вокзальная магистраль, 3 16+
UNIVERSUM: ТЕХНИЧЕСКИЕ НАУКИ Научный журнал Издается ежемесячно с декабря 2013 года Является печатной версией сетевого журнала Universum: технические науки Выпуск: 2(107) Февраль 2023 Часть 2 Москва 2023
УДК 62/64+66/69 ББК 3 U55 Главный редактор: Ахметов Сайранбек Махсутович, д-р техн. наук; Заместитель главного редактора: Ахмеднабиев Расул Магомедович, канд. техн. наук; Члены редакционной коллегии: Горбачевский Евгений Викторович, канд. техн. наук; Демин Анатолий Владимирович, д-р техн. наук; Звездина Марина Юрьевна, д-р. физ.-мат. наук; Ким Алексей Юрьевич, д-р техн. наук; Козьминых Владислав Олегович, д-р хим. наук; Ларионов Максим Викторович, д-р биол. наук; Манасян Сергей Керопович, д-р техн. наук; Мажидов Кахрамон Халимович, д-р наук, проф; Мартышкин Алексей Иванович, канд.техн. наук; Мерганов Аваз Мирсултанович, канд.техн. наук; Пайзуллаханов Мухаммад-Султанхан Саидвалиханович, д-р техн. наук; Радкевич Мария Викторовна, д-р техн наук; Серегин Андрей Алексеевич, канд. техн. наук; Старченко Ирина Борисовна, д-р техн. наук; Усманов Хайрулла Сайдуллаевич, д-р техн. наук; Юденков Алексей Витальевич, д-р физ.-мат. наук; Tengiz Magradze, PhD in Power Engineering and Electrical Engineering. U55 Universum: технические науки: научный журнал. – № 2(107). Часть 2, М., Изд. «МЦНО», 2023. – 72 с. – Электрон. версия печ. публ. – http://7universum.com/ru/tech/archive/category/2107 ISSN : 2311-5122 DOI: 10.32743/UniTech.2023.107.2 Учредитель и издатель: ООО «МЦНО» ББК 3 © ООО «МЦНО», 2023 г.
Содержание 4 4 Статьи на русском языке 4 Информатика, вычислительная техника и управление 21 АНАЛИЗ АЛГОРИТМОВ КЛАССИФИКАЦИИ ТЕКСТОВ 26 Логунова Татьяна Викторовна Щербакова Лидия Викторовна 30 Васюков Василий Михайлович Шимкун Вячеслав Владиславович 30 34 МЕТОДЫ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ ИНТЕГРИРОВАННОЙ КОМПЬЮТЕРНОЙ СИСТЕМЫ ЭЛЕКТРОННОГО БИЗНЕСА 38 Мансурова Махина Яшнаровна 38 РАЗРАБОТКА МАТЕМАТИЧЕСКОЙ МОДЕЛИ ПРОЦЕССА ГИДРООЧИСТКИ ДИЗЕЛЬНОГО ТОПЛИВА 44 Усманов Комил Исроилович Исломова Фарида Камилджановна 51 Якубова Ноилахон Собирджановна 51 Машиностроение и машиноведение 54 ФАКТОРЫ РЕЖИМА ДЕФОРМИРОВАНИЯ Махмудова Наргиза Абдунабиевна 54 Ибодуллаев Тўйчи Неъмат огли 62 ИСПОЛЬЗОВАНИЕ ПРОПАНА В ХОЛОДИЛЬНЫХ УСТАНОВКАХ Салманова Нозима Абдусаматовна Зохидов Миракбар Зокир огли Металлургия и материаловедение ОБЗОР ИССЛЕДОВАНИЯ ТЕХНОЛОГИИ ОКИСЛИТЕЛЬНОГО ОБЖИГА ЗОЛОТОСОДЕРЖАЩИХ УГЛИСТЫХ КОНЦЕНТРАТОВ Сайдахмедова Лола Абдуганиевна Толибов Беҳзод Иброҳимович Жабборова Сурайё Гуломовна Исломов Ильхом Нусратиллоевич ОСОБЕННОСТИ КАЛИБРОВКИ, ТЕХНИЧЕСКОЙ ДИАГНОСТИКИ И ПОВЕРКИ СОВРЕМЕННЫХ ОПТИКО-ЭМИССИОННЫХ АНАЛИЗАТОРОВ, ИСПОЛЬЗУЕМЫХ ПРИ ИССЛЕДОВАНИИ СОСТАВА ДЕФОРМИРУЕМЫХ АЛЮМИНИЕВЫХ СПЛАВОВ СИСТЕМЫ AlMgSi Шарипов Конгратбай Авезимбетович Ибрахимов Фаррухжон Фарходович Процессы и машины агроинженерных систем КАПЕЛЬНОЕ ОРОШЕНИЕ И МЕЛИОРАТИВНОЕ СОСТОЯНИЕ ХЛОПКОВЫХ ПОЛЕЙ АНДИЖАНСКОЙ ОБЛАСТИ Усманов Ш.А. Садиков Э.Р. Строительство и архитектура ПЕРСПЕКТИВЫ ГРАДОСТРОИТЕЛЬНОГО РАЗВИТИЯ ПОТЕНЦИАЛЬНО БИНАРНЫХ МАЛЫХ ГОРОДОВ НА ПРИМЕРЕ ГОРОДОВ СОЛИГАЛИЧ И ЧУХЛОМА КОСТРОМСКОЙ ОБЛАСТИ Долинская Ирина Марковна Пичужкина Полина Дмитриевна АНАЛОГИЧНОСТЬ СИСТЕМ ГОРОДОВ НА КОСЕ НА ПОБЕРЕЖЬЯХ БАЛТИЙСКОГО И ОХОТСКОГО МОРЕЙ КАК ИТОГ ОСВОЕНИЯ ДАЛЬНЕВОСТОЧНЫХ ТЕРРИТОРИЙ РОССИИ В КОНЦЕ XVII–XVIII ВЕКЕ Долинская Ирина Марковна Болдина Наталья Дмитриевна
№ 2 (107) февраль, 2023 г. СТАТЬИ НА РУССКОМ ЯЗЫКЕ ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И УПРАВЛЕНИЕ DOI - 10.32743/UniTech.2023.107.2.15064 АНАЛИЗ АЛГОРИТМОВ КЛАССИФИКАЦИИ ТЕКСТОВ Логунова Татьяна Викторовна канд. техн. наук, доц. кафедры О7, Балтийский Государственный Технический Университет «ВОЕНМЕХ» им. Д.Ф. Устинова, РФ, г. Санкт-Петербург Щербакова Лидия Викторовна канд. техн. наук, доц. кафедры О7, Балтийский Государственный Технический Университет «ВОЕНМЕХ» им. Д.Ф. Устинова, РФ, г. Санкт-Петербург Васюков Василий Михайлович ст. преподаватель, Балтийский Государственный Технический Университет «ВОЕНМЕХ» им. Д.Ф. Устинова, РФ, г. Санкт-Петербург Шимкун Вячеслав Владиславович преподаватель, Балтийский Государственный Технический Университет «ВОЕНМЕХ» им. Д.Ф. Устинова, РФ, г. Санкт-Петербург E-mail: [email protected] ANALYSIS OF ALGORITHMS FOR TEXT CLASSIFICATION Tatiana Logunova Candidate of Technical Sciences, Associate Professor of the O7 Department, Baltic State Technical University \"VOENMEH\" them. D.F. Ustinov, Russia, St. Petersburg Lidiia Shcherbakova Candidate of Technical Sciences, Associate Professor of the O7 Department, Baltic State Technical University \"VOENMEH\" them. D.F. Ustinov, Russia, St. Petersburg Vasilii Vasiukov Senior Lecturer, Baltic State Technical University \"VOENMEH\" them. D.F. Ustinov, Russia, St. Petersburg Viacheslav Shimkun Lecturer, Baltic State Technical University \"VOENMEH\" them. D.F. Ustinov, Russia, St. Petersburg __________________________ Библиографическое описание: АНАЛИЗ АЛГОРИТМОВ КЛАССИФИКАЦИИ ТЕКСТОВ // Universum: технические науки: электрон. научн. журн. Логунова Т.В. [и др.]. 2023. 2(107). URL: https://7universum.com/ru/tech/archive/item/15064
№ 2 (107) февраль, 2023 г. АННОТАЦИЯ Во многих программных продуктах существует потребность в модуле классификации текстов, например, при решении следующих задач возникает необходимость решать задачу классификации текстов: • распознавание эмоциональной окраски текстов, • фильтрация спама, • анализ тональности текста, • разделение документов по тематическим каталогам, • создание голосовых пользовательских интерфейсов. В целом, любые задачи классификации, где часть данных являются текстовыми, можно рассматривать как задачи классификации текстов. При классификации текста, над текстом, как правило, осуществляются следующие последовательные операции: предобработка текста, извлечение признаков, классификация текста. Разработчики программных модулей классификации текстов сталкиваются с проблемой выбора какого-то варианта для каждой из вышеперечисленных операций. Так как на каждом шаге существует достаточно большое количество возможных вариантов, то на поиск лучших вариантов, зачастую, необходимо значительное время и вычислительные ресурсы. Неправильный выбор на любом шаге построения модуля классификации текстов ведет к снижению качества классификации. При этом трудозатраты на проведение подобных исследований при разработке программного обеспечения могут быть сопоставимы с трудозатратами на разработку самого программного обеспечения. В данной статье рассматриваются все выше- перечисленные операции и предлагается анализ алгоритмов классификации текстов. ABSTRACT In many software products, there is a need for a text classification module, for example, when solving the following tasks, it becomes necessary to solve the problem of text classification: • recognition of the emotional coloring of texts, • spam filtering, • analysis of the tone of the text, • division of documents into thematic directories, • creation of voice user interfaces. In general, any classification problem, where part of the data is textual, can be considered as a text classification problem. When classifying a text, the following sequential operations are usually performed on the text: text preprocessing, feature extraction, text classification. Developers of software modules for text classification are faced with the problem of choosing some option for each of the above operations. Since at each step there are a fairly large number of possible options, the search for the best options often requires significant time and computational resources. Wrong choice at any step of building a text classification module leads to a decrease in the quality of classification. At the same time, the labor costs for conducting such research in software development can be comparable to the labor costs for developing the software itself. This article discusses all of the above operations and proposes an analysis of text classification algorithms. Ключевые слова: алгоритмы классификации текстов; мешок слов; методы извлечения признаков; пред- обработка текста; векторное представление; градиентный бустинг; многослойный персептрон; нейронные сети. Keywords: text classification algorithms; bag of words; feature extraction methods; text preprocessing; vector representation; gradient boosting; multilayer perceptron; neural networks. ________________________________________________________________________________________________ 1. Параметры влияющие • какие наиболее распространённые методы на качество классификации текста извлечения признаков существуют; Процесс классификации текста, обычно, состоит • какие алгоритмы классификации можно ис- из следующих трёх шагов: пользовать для решения задачи классификации текста. • предобработка текста; 2. Предобработка текста • извлечение признаков из текста; • классификация текста с помощью некоторого Наиболее часто встречающаяся предобработка алгоритма. текста содержит следующие шаги [1]: Любой из этих шагов влияет на качество класси- фикации, поэтому для проведения сравнительного • удаление всех нерелевантных символов эксперимента возникает необходимость рассмотрения (например, любые символы, не относящиеся к циф- различных вариантов процесса классификации при- робуквенным); менительно к различным задачам классификации. В данном разделе описываются данные три шага про- • разбиение текста на токены; цесса, а именно: • удаление нерелевантных слов (например, упо- • из чего, обычно, состоит предобработка текста; минания в Twitter или URL-ы); • перевод всех слов в один регистр (например, нижний) для уменьшения количества одинаковых слов; 5
№ 2 (107) февраль, 2023 г. • удаление стоп-слов; 3.2 Bag-of-words и TF-IDF • проведение стемминга или лемматизации. Как и в методе Bag-of-words, каждый документ Токенизация текста – это метод предварительной представляется вектором, но координаты этого век- обработки текстов, при котором текст разбивается тора рассчитываются в соответствии со статистиче- на слова, фразы, символы или другие значимые эле- ской мерой TF-IDF [1]. менты, называемые токенами. Стоп-слова – это слова, не несущие никакой смы- TF-IDF (Term Frequency – Inverse Document словой нагрузки. Например, слова \"и\", \"в\", \"только\" Frequency) – статистическая мера, используемая для не несут никакой ценности и только добавляют шум оценки важности слова в контексте документа. в данные. При этом надо понимать, что невозможно Вычисляется по формуле (2). Большой вес в TF-IDF создать универсальный список стоп-слов, для каждого получают слова с высокой частотой в пределах кон- конкретного случая список будет отличаться. кретного документа и с низкой частотой употребления Обычно тексты содержат разные грамматические в других документах. формы одного и того же слова, а также могут встре- чаться однокоренные слова. Лемматизация и стемминг TF-IDF (������, ������, ������) = ������������(������, ������) ∙ ������������������(������, ������), (2) преследуют цель привести все встречающиеся слово- формы к одной, нормальной словарной форме. где w – слово из словаря, Стемминг – это грубый эвристический процесс, d – документ из множества документов D, который отрезает «лишнее» от корня слов, часто это TF – частота слова, оценивает важность слова w в приводит к потере словообразовательных суффиксов. Лемматизация – это более тонкий процесс, кото- пределах отдельного документа согласно формуле (3), рый использует словарь и морфологический анализ, IDF – обратная частота документа. чтобы в итоге привести слово к его канонической форме – лемме. ������������(������, ������) = ������������ , (3) Отличие в том, что стеммер (конкретная реали- ∑���������=��� 1 ������������������ зация алгоритма стемминга) действует без учёта кон- текста и, соответственно, не делает разницы между где nw – количество вхождений слова w в документ d, словами, которые имеют разный смысл в зависи- m – размер словаря. мости от части речи. Однако у стеммеров есть своё Учёт IDF уменьшает вес широко употребляемых преимущество – они работают быстрее. Большинство современных алгоритмов машин- слов, что показывает формула (4). ного обучения ориентированы на признаковое описание объектов, поэтому все документы обычно ������������������(������, ������) = log |{������ ∈ |������| ∈ ������}|, (4) переводят в вещественное пространство признаков. ������ | ������ Для этого используют идею о том, что за принадлеж- ность документа к некоторому классу отвечают слова, где |D| – количество документов в коллекции, а тексты из одного класса будут использовать много схожих слов. |{d D | w d}| – число документов из коллек- ции D, в которых встречается слово w. 3. Методы извлечения признаков 3.3 Bag-of-ngrams и TF-IDF 3.1 Bag-of-words Часто информацию в тексте несут не только от- При использовании данного подхода каждому дельные слова, но и некоторая последовательность тексту сопоставляется вектор размерности словаря слов, например, фразеологизмы – устойчивые сочета- набора текстов, что описывается формулой (1). Под ние слов, значение которых не определяется значе- словарём подразумевается множество всех слов нием входящих в них слов, взятых по отдельности. входящих в набор текстов. Речевой оборот «как рыба в воде» означает чувство- вать себя уверенно, очень хорошо в чем-либо разби- ������ → ������ ∈ ℝ������: ������������ = ������������������, ������������ ∈ ������, i=1…m (1) раться. Смысл данного выражения будет передан неверно, если учитывать его слова по отдельности. где:d – документ, ������ ∈ ℝ – последовательность векторов размерно- Для того чтобы учесть такие особенности языка предлагается при переводе текстов в векторное сти m, представление учитывать помимо слов, N-граммы. m – размер словаря, N-граммы – это последовательности из N слов. i- К примеру, для текста «мама мыла раму» получаем w – слово из словаря W, биграммы «мама мыла» и «мыла раму». В задаче nw – количество вхождений слова w в документ d. классификации текстов N-граммы являются индика- При всей простоте реализации данный подход торами того, что данные N слов встретились рядом. имеет ряд недостатков: На практике в словарь добавляют не все N-граммы, а только те, которые встречаются достаточно часто • для больших наборов текстов размерность в текстах, а также редко применяют N-граммы длин- словаря, а, следовательно, и размерность вектора, нее, чем триграммы, так как словосочетания длинны представляющего текст, может исчисляться сотнями более трёх редко встречаются в текстах. тысяч, а иногда и миллионами; Метод Bag-of-ngrams и TF-IDF аналогичен методу • не учитывается контекст слова в документе. Bag-of-words и TF-IDF, только вектор признаков для каждого документа содержит TF-IDF k-грамм, где k = 1…N. 6
№ 2 (107) февраль, 2023 г. 3.4 Word2vec Принцип работы сети CBOW заключается в сле- дующем: В алгоритме word2vec [2], [3] каждому слову со- поставляется вектор из вещественных чисел евкли- • каждый вход сети – это вектор в one-hot пред- дова пространства ℝ������ для некоторого d (обычно ставлении (вектор, состоящий из нулей и единиц, где несколько сотен). Базовое положение состоит в том, всего одна единица в позиции, обозначающей номер что геометрические соотношения в пространстве ℝ������ слова в словаре) размерности V, где V – размер словаря; будут соответствовать семантическим соотношениям между словами, например, ближайшие соседние • скрытый слой сети – это фактически и есть слова в этом пространстве окажутся его синонимами матрица W векторных представлений слов; n-я стро- или другими тесно связанными словами и т. д. ка W содержит представление n-го слова из словаря; Данное предположение основано на дистрибутивной гипотезе – слова с похожим смыслом будут встре- • при вычислении выхода скрытого слоя берётся чаться в похожим контекстах. среднее всех входных векторов; Основные преимущества word2vec перед стати- • на выходе получается некая оценка uj для стическими подходами: каждого слова в словаре; затем апостериорное распре- деление модели вычисляется с помощью функции • размерность вектора, представляющего слово, softmax, описанной по формуле (5): не зависит от размера словаря, а задаётся при обучении модели; ������ ������������ (5) ������̂(������|������1, ������2, … , ������������) = ∑������������′=1 ������������������′ • вектора в word2vec моделируют семантические отношения между словами. • таким образом, функция потери на одном окне состоит в том, чтобы сделать апостериорное Модель word2vec была представлена сразу в распределение как можно более похожим на распре- двух вариантах: в виде непрерывного мешка слов деление данных, как показано в формуле (6): (continuous bag of words, CBOW) и в виде архитектуры ������ skip-gram. Введём следующие обозначения: ������ = − log ������̂(������|������1, ������2, … , ������������) = −������������ + log ∑ ������������������′ (6) i – слово, ck – слово из контекста слова i (слово, находящееся ������′=1 перед словом i), k = 1…n, где ������������ – это некая оценка для каждого слова в словаре. n – размер окна – количество слов, находящихся А модель skip-gram работает прямо противопо- перед словом i, которые модель будет учитывать, ложным образом – модель пытается предсказать wk – вектор из контекста слова i (вектор, пред- каждое слово контекста по данному слову. Архитек- тура соответствующей сети показан на рисунке 2 [2]. ставляющий собой слово ck), k = 1…n, L – функция потерь модели (её модель и будет На выходном слое сети получается n мультино- миальных распределений, по одному на каждое слово оптимизировать). контекста (7). Архитектура сети CBOW представлена на ри- сунке 1 [2]. ������ ������������������ (7) ������̂(с������|������) = ∑������������′=1 ������������������′ Функция потери на одном окне может быть выражена формулой (8). ������ = − log ������̂(������1, ������2, … , ������������|������) ������ ������ = − ∑ ������������ + ������ log ∑ ������������������′ (8) ������=1 ������′=1 Рисунок 1. Архитектура сети CBOW 7
№ 2 (107) февраль, 2023 г. Рисунок 2. Архитектура сети skip-gram обучении модели, так же, как и длина контекста (какое В обоих подходах нейронная сеть используется количество слов будет оказывать влияние на данное для обучения матрицы векторных представлений слово). слов, которые являются весами скрытого слоя нейронной сети. При этом размерность векторного 3.5 Doc2vec представления слова (которая является размерно- стью выходного слоя нейронной сети) задается при Целью алгоритма doc2vec является создание векторного представления документа, вне зависимо- сти от его длины. Для реализации этой цели исполь- зуется модель word2vec с добавлением ещё одного вектора, который называется Paragraph ID [4]. Теперь для того чтобы предсказать следующее слово исполь- зуются не только слова, но и уникальный вектор документа, в котором это слово предсказывается. Таким образом обучается не только матрица W, соответствующая векторному представлению слов, но и матрица D, строки которой соответствуют век- торному представлению документов. Такая модель называется Distributed Memory version of Paragraph Vector (PV-DM) и является изменённой версией мо- дели word2vec CBOW. Архитектура модели PV-DM показана на рисунке 3 [4]. Другой вариант архитектуры модели doc2vec основан на модели word2vec skip-gram называется Distributed Bag of Words version of Paragraph Vector (PV-DBOW). Архитектура модели PV-DBOW пока- зана на рисунке 4 [4]. В данном случае модель обучается путём пред- сказывания для текстового документа слов, которые могут в него входить. Рисунок 3. Архитектура модели doc2vec PV-DM Рисунок 4. Архитектура модели doc2vec PV-DBOW 8
№ 2 (107) февраль, 2023 г. 3.6 GloVe В статье [5] предлагается в качестве функции по- терь взять взвешенную среднеквадратичную ошибку, В отличие от алгоритма word2vec, алгоритм GloVe описанную в формуле (15) с весовой функцией, опи- санной в формуле (16). Оптимизируя функционал J, опирается на глобальные статистики. В качестве описанный в формуле (15), можно получить векторы ������������. такой глобальной статистики берётся вероятность совместного появления слов в документах [5]. Введём некоторые обозначения: ������ X – матрица совместной встречаемости слов, ������ = ∑ ������(������������������)(���������������������̃��������� + ������������ + ���̃��������� − log ������������������)2 (15) ������������������ (элементы матрицы X) – количество раз, ������,������=1 когда слово j появилось в контексте слова i, ������������ – ∑������ ������������������ – сумма элементов строки i матрицы X, ������(������) = {(������/���1������,���в���������д���)р������у, егослмис���л���у<ча���е��������������������� ������������������ ������������������ – ������������ – вероятность появления слова j в кон- (16) тексте слова i. Рассмотрим отношение вероятностей встречае- 4. Алгоритмы классификации мости слов i и j к пробному слову k, описанное в 4.1 Логистическая регрессия формуле (9). Отношения между словами i и j можно Логистическая регрессия [1] является линейной моделью, описанной в формуле (17), позволяющей понять, изучая отношения вероятностей их появления предсказывать вероятности принадлежности объекта к данному классу. К преимуществам логистической для различных пробных слов k (в силу дистрибутивной регрессии относятся: интерпретируемость человеком и высокая скорость работы алгоритма, а к недостат- гипотезы). кам – низкая точность, по сравнению с более слож- ными моделями. ������ (������������ , ������������ , ���̃���������) = ������������������ , (9) ������������������ где ������������, ������������ – вектора слов i и j, ������ = ∑������������=1 ������������ ∗ ������������ + ������0, (17) ���̃��������� – вектор пробного слова. После некоторых предположений о функции F где ������ = (������������), ������ = 0. . ������ – вектор параметров модели; ������ = (������������), ������ = 1. . ������ – вектор, описывающий объект. (зависит не от двух аргументов ������������, ������������, а от их разности В логистической регрессии делается предположе- и имеет единственный аргумент – число) ее можно представить в виде формулы (10). ние о том, что вероятность принадлежности объекта x к классу 1 будет выражаться формулой (18). ������ ((������������ − ������������ )������ ���̃��������� ) = ������������������ (10) ������������������ В силу симметрии (замена ������ на ������������) можно потре- ������{������ = 1|������} = ������(������) = 1 , (18) бовать от соотношения, описанного в формуле (10) 1+������−������ быть представимым в виде формулы (11). ������ ((������������ − ������������ )������ ���̃��������� ) = ������(������������ ������ ���̃��������� ) (11) Обучающая выборка состоит из пар ������(������������ ������ ���̃��������� ) (������(������), ������(������)), ������ = 1. . ������. Из соотношений, описанных в формулах (10) и (11) можно получить формулу (12). При подборе параметров модели используется метод максимального правдоподобия, согласно кото- рому выбираются параметры ������, максимизирующие значение функции правдоподобия, что описано в формуле (19) на обучающей выборке. ������ (������������ ������ ���̃��������� ) = ������������������ = ������������������ (12) ���̂��� = arg max ������(������) ������������ ������ ������ Это соотношение можно разрешить, приняв за (19) функцию F экспоненту, описанную в формуле (13). = arg max ∏ ������{������ = ������(������)|������ = ������(������)} ������ ������=1 ���������������������������̃��������� = log ������������������ − log ������������ (13) Максимизация функции правдоподобия эквива- лентна максимизации её логарифма, согласно фор- Так как в соотношении, описанном в формуле (13) муле (20). ������������ не зависит от k, поэтому можно заменить ������������ на два смещения (их два для поддержания симметрии соот- ������ (20) ношения относительно i и k), получая формулу (14). ln ������(������) = ∑ ������(������) ln ������(������������������(������)) ���������������������̃��������� + ������������ + ���̃��������� = log ������������������ (14) где b – это смещение. ������=1 + (1 − ������(������)) ln (1 − ������(������������������(������))) Выражение из формулы (20), обычно, максими- зируется с использованием градиентного спуска. 9
№ 2 (107) февраль, 2023 г. 4.2 Наивный байесовский классификатор 4.3 Метод опорных векторов (SVM) Наивный байесовский классификатор – это набор Метод опорных векторов основан на понятии алгоритмов, основанных на применении теоремы оптимальной разделяющей гиперплоскости [7]. Байеса с «наивным» предположением об условной Рассмотрим случай бинарной классификации. независимости между каждой парой признаков при заданном значении переменной класса [6]. Введем обозначения: • обучающая выборка ������������ = (������������, ������������)������������=1, Функционал среднего риска из формулы (21) – • ������������ – объекты, векторы из множества ������ = ℝ������, ожидаемая величина потери при классификации • ������������ – метки классов, элементы множества ������ = объектов алгоритмом a. {−1, +1}. Необходимо найти параметры ������ ∈ ℝ������, ������0 ∈ ℝ Существует теорема об оптимальности байесов- линейной модели классификации по формуле (26). ского классификатора [6], согласно которой, если Данные параметры и будут являться разделяющей известны априорные вероятности ������(������), функции гиперплоскостью. правдоподобия ������(������|������) и величина потери ������������ при ошибке на объекте класса ������ ∈ ������, тогда минимум ������(������; ������, ������0) = sign(〈������, ������〉 − ������0) (26) среднего риска ������(������) достигается алгоритмом по формуле (22). ������(������) = ∑ ������������ ∫[������(������) ≠ ������] ������(������, ������)������������ (21) Будем минимизировать эмпирический риск – количество объектов в тестовой выборке, на кото- ������∈������ рых классификатор ошибся согласно формуле (27). где a – алгоритм классификации объектов, ������ x – элемент матрицы X ∑[������(������������; ������, ������0) ≠ ������������] ������=1 (27) ������ ������(������) = arg max ������������������(������)������(������|������) (22) = ∑[������������ (������ , ������0) < 0] → min, ������∈������ ������,������0 ������=1 В наивном байесовском классификаторе делается где ������������(������, ������0) = (〈������, ������〉 − ������0)������������ – отступ объекта ������������. предположение, что все признаки, описывающие Так как эмпирический риск – кусочно-постоянная объект ������, являются независимыми случайными вели- функция, то заменяя ее непрерывной по параметрам чинами в формуле (23). оценкой сверху, получим формулу (28). ������ (23) ������ ������(������|������) = ∏ ������������(������������|������), ������(������, ������0) = ∑[������������(������, ������0) < 0] ≤ ������=1 ������=1 ������ где ������������(������������|������) – плотность распределения значений i-ого признака для класса y; ≤ ∑(1 − ������������(������, ������0))+ (28) ������ – объект из множества ������, ������ = (������1, … , ������������). ������=1 С учетом формулы (23) классификатор из фор- 1 мулы (22) можно записать в виде формулы (24). + 2������ ‖������‖2 → min, ������,������0 ������ где С – гиперпараметр регуляризации, (������)+ – операция положительной срезки, ������(������) = arg max (ln ���������������̂���(������) + ∑ ln ������̂������ (������������ |������)) (24) ‖������‖ – норма вектора w. Для случая линейно неразделимой выборки ������∈������ ������=1 формулу (28) можно переписать в виде задачи мате- Наивный байесовский классификатор может быть матического программирования по формуле (29). как параметрическим, так и непараметрическим, в за- висимости от того, каким методом восстанавливаются 1 ‖������‖2 + ������ ������ → min одномерные плотности. 2������ ∑ ������������ ������,������0,������ Например, если были выбраны гауссовские рас- ������=1 (29) пределения для плотностей ������������(������������|������) , то алгоритм, описанный в формуле (24), можно записать в виде ������������ ≥ 1 − ������������(������, ������0), ������ = 1, … , ������ формулы (25). В таком случае алгоритм из формулы (25) будет являться линейным классификатором. { ������������ ≥ 0, ������ = 1, … , ������ ������(������) = arg max (ln ���������������̂���(������) − 1 ������̂���T���Σ̂ −1������̂������ где ������������ – набор дополнительных переменных, характе- 2 ризующих величину ошибки. Это позволит алгоритму ������∈������ (25) допускать ошибки на обучающей выборке и работать в случае, если классы линейно неразделимы. + ������TΣ̂−1������̂������) , Задаче, описанной формулой (29), эквивалентна где ������̂������ – оценка математического ожидания, задача безусловной минимизации, которую можно Σ̂−1 – оценка ковариационной матрицы. описать формулой (30). 10
№ 2 (107) февраль, 2023 г. 1 ������ ������ 2������ ‖������‖2 + ������ ∑(1 − ������������ (������ , ������0))+ → min (30) ������ = ∑ ������������������������������������ (32) ������=1 ������,������0 ������=1 ������0 = (〈������, ������〉 − ������������), для любого ������: ������������ > 0, ������������ = 1 Для существования минимума из формулы (30) Тогда классификатор можно будет записать в необходимо несколько условий, описанных в фор- виде формулы (33). муле (31). ������ ������ ������(������) = sign (∑ ������������������������〈������, ������������〉 − ������0) (33) ������ = ∑ ������������������������������������ ������=1 ������=1 (31) У SVM существует нелинейное обобщение, ������ в котором скалярное произведение 〈������, ������′〉 заменяется нелинейной функцией ������(������, ������′), которая называется ∑ ������������������������ = 0 ядром. При такой замене происходит переход из ис- ������=1 ходного признакового пространства, в котором классы могут быть линейно неразделимы, в другое ������������ + ������������ = ������, ������ = 1, … , ������ признаковое пространство, в котором классы уже могут быть линейно разделены (в зависимости от Решая задачу, описанную в формулой (31) полу- выбранного ядра). чаем решение, описанное формулой (32), где числа ������������ определяются численными методами оптимизации Примеры использования различных видов ядер из формулы (31). в SVM показаны на рисунке 5. Рисунок 5. Примеры использования различных ядер в SVM 4.4 NBSVM ������ = ������ + ∑������:������(������)=−1 ������(������)– вектор, где каждый элемент равен количеству раз, когда слово i встретилось в до- Алгоритм использует мультиномиальный наив- ный байесовский классификатор (MNB) для получения кументах класса -1, плюс сглаживающий параметр, признакового описания обучающей выборки и обу- ������ – сглаживающий параметр (необходим для чает на полученных признаках SVM, после чего ис- пользует интерполяцию, полученного при обучении избегания случаев равенства числителя или знаме- SVM вектора весов, для получения модели NBSVM [8]. нателя нулю). За основу алгоритма берётся линейный классифика- тор, описанный в формуле (34). В (MNB) вектор весов модели будет равен век- ������(������) = sign(〈������������, ������〉 + ������) (34) тору r. Однако, вместо прямого использования ������(������), лучший результат даёт бинаризация признаков ������(������), что достигается заменой ������(������) на ���̂���(������) согласно фор- муле (36). Пусть решается задача бинарной классификации, ���̂��� (������) = {1, ������ (������) ≥ 1 (36) где:������(������) – bag-of-words вектор для объекта i, 0, ������ (������) = 0 ������(������) ∈ {−1,1} – класс объекта i, Обучая SVM (30), с использованием признаков |������| – объём словаря. ������(������)���̂���(������) можно получить вектор весов w. Сама модель Определим вектор r в соответствии с формулой NBSVM использует интерполяцию полученного при обучении SVM вектора весов с помощью формулы (35). (37). ������ ������ = ln ,‖������‖ (35) ������ ������′ = (1 − ������)���̅��� + ������������, ‖������‖ (37) где ������ = ������ + ∑������:������(������)=1 ������(������) – вектор, где каждый эле- где ���̅��� = ‖������‖ – средняя значимость вектора w, мент равен количеству раз, когда слово i встретилось в документах класса 1, плюс сглаживающий параметр, |������| ������ ∈ [0,1] – параметр интерполяции. 11
№ 2 (107) февраль, 2023 г. 4.5 Бинарное решающее дерево Общая идея бустинга состоит в том, что на каждом шаге построения алгоритма в композицию добавля- Бинарное решающее дерево – это алгоритм клас- ется такой новый базовый алгоритм ������������ с весом ������������ так, сификации a(x), задающийся бинарным деревом, в чтобы минимизировать функционал качества, опи- котором каждой внутренней вершине ������ ∈ ������ припи- санный в формуле (39). сан предикат ������������: ������ → {0, 1}, а каждой терминальной вершине ������ ∈ ������ приписано имя класса ������������ ∈ ������ [7]. ������(������, ������; ������������) = При классификации объекта ������ ∈ ������ он проходит ������ ������−1 (39) по дереву путь от корня до некоторого листа. В листе решающего дерева, как правило, содержатся объекты = ∑ ℒ (∑ ������������������������(������������) + ������������(������������), ������������) → min, тренировочной выборки (обычно не сами объекты, а их классы), попавшие туда при обучении, и класс ������=1 ������=1 ������,������ классифицируемого объекта определяется в зависи- мости от преобладающего класса объектов в данном где ������ – количество объектов в обучающей выборке, листе. ℒ – функция потерь на одном объекте. Пример части решающего дерева показан на Если взять выражение ������������−1,������ = ∑������������=−11 ������������������������(������������) в рисунке 6. качестве текущего приближения на k-ом шаге обу- чения алгоритма, а ������������,������ = ∑������������=1 ������������������������(������������) – в качестве следующего приближения, то можно применить градиентный метод оптимизации к функционалу из формулы (38), тогда компоненты вектора градиента будут иметь вид, описанный в формуле (40). ������������ = ℒ′(������������−1,������, ������������), (40) Главная идея алгоритма заключается в поиске Рисунок 6. Пример части решающего дерева такого базового алгоритма В основе каждого алгоритма построения реша- ������������, чтобы вектор (������������(������������))������������=1 приближал вектор ющего дерева лежит жадное добавление следующей антиградиента (−������������)������������=1, что может быть выражено вершины. При добавлении новой вершины предикат в виде формулы (41): выбирается таким образом, чтобы максимизировать информативность. ������ 4.6 Градиентный бустинг ������������ ≔ ������������������ max ∑(������(������������ ) + ������������ )2 (41) Градиентный бустинг – это алгоритм машинного ������ ������=1 обучения, являющийся линейной (выпуклой) ком- бинацией базовых алгоритмов [7], что может быть В качестве базовых алгоритмов в градиентном выражено формулой (38). бустинге, чаще всего, используют решающие дере- вья небольшой глубины, так как при использовании более «сильных» алгоритмов происходит быстрое переобучение. ������ (38) 4.7 Многослойный персептрон (MLP) ������(������) = ∑ ������������������������, ������ ∈ ������, ������������ ∈ ℝ+, Многослойный персептрон представляет собой искусственную нейронную сеть прямого распростра- ������=1 нения, содержащую входной слой, один или несколько где T – количество базовых алгоритмов, скрытых слоёв и выходной слой [7]. Основным эле- ������������ – вес базового алгоритма с номером t, ментом такой сети является нейрон, показанный ������������ – базовый алгоритм с номером t, на рисунке 7 [7]. X – множество объектов. Рисунок 7. Модель нейрона 12
№ 2 (107) февраль, 2023 г. Описание обозначений на рисунке 7: ������ = (������������)���������=��� 1 – векторное представление объекта, ������������������ – веса нейрона, ������ – функция активации. Многослойный персептрон показан на рисунке 8 [7]. Рисунок 8. Многослойный персептрон Обучение сети происходит посредством мини- 4.8 Рекуррентная нейронная сеть (RNN) мизации функционала качества Q (42). Рекуррентные нейронные сети предназначены ������ для решения задач, связанных с обработкой после- довательностей, а так как текст является последо- ������(������) ≔ ∑ ℒ(w, ������������ , ������������ ) → min, (42) вательностью символов, то данные сети часто применяются при решении задач, связанных с обра- ������=1 ������ боткой текстов [9]. где w – вектор весов нейронной сети, В отличие от многослойных персептронов в рекур- ℒ – функция потерь на одном объекте, рентных нейронных сетях связи между нейронами ������������ – признаковое описание i-ого объекта, могут идти не только от нижнего слоя к верхнему, ������������ – ответ на i-ом объекте. но и от нейрона к «самому себе», точнее, к предыду- Основным методом обучения нейронных сетей щему значений самого этого нейрона или других нейронов того же слоя. является градиентный спуск и его адаптивные вари- анты, такие как: Adagrad, Adadelta, RMSprop, Adam. Архитектура «простой» RNN представлена на рисунке 9 [9]. 13
№ 2 (107) февраль, 2023 г. Рисунок 9. Архитектура «простой» RNN Описание обозначений элементов рисунка 9: Мотивация использования двунаправленных RNN состоит в том, чтобы получить состояние, отражаю- • W – матрица весов для перехода между скры- щее контекст и слева, и справа для каждого элемента тыми состояниями, последовательности. • U – матрица весов для входов, 4.9 LSTM • V – матрица весов для выходов, «Обычные» RNN очень плохо справляются с си- туациями, когда нужно что-то запомнить «надолго»: • ������������ – скрытое состояние на шаге i, влияние скрытого состояния или входа с шага t на • ������������ – вход сети на шаге i, последующие состояния RNN экспоненциально зату- • ������������ – выход сети на шаге i, хает. Для решения данной проблемы конструкцию • f и h – функции активации. нейрона сети усложняют, моделируя в том или ином Из рисунка 9 можно получить формальное опи- виде «долгую память». Одной из таких конструкций сание сети в момент времени t (43). является LSTM (Long Short-Term Memory) [10]. Стан- дартная архитектура LSTM-ячейки показана на ри- ������������ = ������ + ������������������−1 + ������������������, ������������ = ������(������������) (43) сунке 10 [10]. В LSTM есть три основных вида узлов, ������������ = ������ + ������������������, ������������ = ℎ(������������) которые называются гейтами: входной (input gate), забывающий (forget gate) и выходной (output gate), Часто вместо «обычной» RNN используют дву- а также собственно рекуррентная ячейка со скрытым направленные RNN – две RNN одна из которых читает состоянием. слова текста слева направо, а другая – справа налево. При обучении такой сети используются скрытые со- стояния обеих сетей (обычно происходит конкатена- ция векторов, описывающих скрытые состояния). Рисунок 10. LSTM: а – обозначение гейта с двумя входами; б – структура LSTM-ячейки 14
№ 2 (107) февраль, 2023 г. Описание обозначений элементов рисунка 10: Состояние ячейки ������������ выражается формулой (48). • ������������ – входной вектор во время t, ������������ = ������������⨀������������−1 + ������������⨀���������′��� (48) • ℎ������ – вектор скрытого состояния во время t, • ������������ – вектор состояния ячейки во время t, Скрытое состояние ℎ������ выражается формулой (49). • ������������ (с различными вторыми индексами) – матрицы весов, применяемые ко входу, ℎ������ = ������������⨀������������������ℎ(������������) (49) • ������ℎ (с различными вторыми индексами) – Если сравнивать с ячейкой «обычной» RNN, матрицы весов, в различных рекуррентных соедине- LSTM-ячейка имеет более сложную структуру – ниях, у LSTM-ячейки по 4 матрицы W и U, а также имеется • ������ (с различными индексами) – векторы свобод- вектор состояния ячейки ������������, который выполняет ных членов. функцию памяти. Скрытые состояния в LSTM могут, если сама ячейка не решит их перезаписать, сохранять Формальное описание сети в момент времени t свои значения неограниченно долго, что решает представлено формулами (44) – (49). проблему «исчезающих градиентов»: независимо от матрицы рекуррентных весов ошибка сама собой Кандидат в состояние ячейки ���������′��� выражается затухать не будет. формулой (44). ���������′��� = ������������������ℎ(������������������������������ + ������ℎ������ℎ������−1 + ������������′) (44) Входной гейт ������������ выражается формулой (45). 4.10 GRU ������������ = ������(������������������������������ + ������ℎ������ℎ������−1 + ������������ ) (45) LSTM требует довольно значительных ресурсов (в LSTM-ячейке гораздо больше матриц, чем в ячейке Забывающий гейт ������������ выражается формулой (46). «обычной» RNN), поэтому после исследований LSTM, направленных на уменьшение количества обучаемых ������������ = ������(������������������������������ + ������ℎ������ℎ������−1 + ������������ ) (46) параметров при сохранении эффекта долгосрочной памяти была создана модель GRU (gated recurrent Выходной гейт ������������ выражается формулой (47). unit) [11]. Было выяснено, что критически важными компонентами для успешной работы LSTM являются ������������ = ������(������������������������������ + ������ℎ������ℎ������−1 + ������������) (47) два гейта: выходной и забывающий. В архитектуре GRU используется идея совмещения выходного и забывающего гейта, а скрытое состояние ℎ������ совме- щено со значением памяти ������������. Архитектура GRU- ячейки показана на рисунке 11 [11]. Рисунок 11. Архитектура GRU-ячейки 15
№ 2 (107) февраль, 2023 г. Описание обозначений элементов рисунка 11: Основная разница между GRU и LSTM заключа- • ������������ – гейт обновления (update gate), который и ется в том, что GRU пытается сделать двумя гейтами является комбинацией выходного и забывающего то же самое, что LSTM делает тремя. Обязанности гейта, забывающего гейта ������������ в LSTM здесь разделены между • ������������ – гейт перезагрузки, двумя гейтам: ������������ и ������������. Кроме того, не возникает второй • ℎ������ – скрытое состояние в момент времени t. нелинейности на пути от входа к выходу, как в случае Принцип работы GRU описан формулами (50) – с LSTM. (53). 4.11 Сверточная нейронная сеть (CNN) Гейт обновления ������������ выражается формулой (50). Сверточные нейронные сети (convolutional neural ������������ = ������(������������������������������ + ������ℎ������ℎ������−1 + ������������ ) (50) networks, CNN) – это весьма широкий класс архитек- тур, основная идея которых состоит в том, чтобы Гейт перезагрузки ������������ выражается формулой (51). переиспользовать одни и те же части нейронной сети для работы с разными маленькими, локальными ������������ = ������(������������������������������ + ������ℎ������ℎ������−1 + ������������ ) (51) участками входов [9]. Изначально, сверточные сети были придуманы для решения задач, связанных с Кандидат в скрытое состояние ℎ���′��� выражается обработкой изображений, для чего в них применя- формулой (52). ются двумерные свертки. Для решения задач, связан- ных с обработкой последовательностей, вместо дву- ℎ���′��� = ������������������ℎ(������������ℎ′������������ + ������ℎℎ′(������������⨀ℎ������−1)) (52) мерных сверток используются одномерные. Основная идея сверточных сетей в том, чтобы дать сети обу- Скрытое состояние ℎ������ выражается формулой (53). читься выявлению признаков во входных данных с помощью сверточных слоев, а затем, подать вычислен- ℎ������ = (1 − ������������)⨀ℎ���′��� + ������������⨀ℎ������−1 (53) ные признаки на вход полносвязной сети. Сверточная сеть для обработки текстов показана на рисунке 12. Рисунок 12. Одномерная сверточная сеть для обработки текстов 4.12 Трансформер а декодер берёт последовательность ������ и создаёт Многие архитектуры, использующие модель вни- выходную последовательность символов (������1, … , ������������). мания, применяют ее вместе с рекуррентными слоями. На каждом шаге модель является авторегрессион- В отличие от таких моделей архитектура трансфор- ной, потребляя ранее сгенерированные символы в мер полагается только на механизм внимания [12]. качестве дополнительных входных данных при гене- рации следующего. Self-attention – это механизм внимания, связываю- щий различные позиции одной последовательности Трансформатор следует этой общей архитектуре, для вычисления представления последовательности. используя сложенные слои self-attention и точечные, полносвязные слои как для кодера, так и для деко- Трансформер использует архитектуру кодер- дера, показанные в левой и правой частях рисунка 13 декодер [9]. Кодер отображают входную последо- соответственно [12]. вательность символов (������1, … , ������������) в последователь- ность вещественных значений ������ = (������1, … , ������������), 16
№ 2 (107) февраль, 2023 г. Рисунок 13. Архитектура трансформер Кодер состоит из стека N=6 одинаковых слоёв. производит Multi-Head attention над выходом стека Каждый слой состоит из двух подслоёв. Первый кодера. Также, как и в кодере, каждый подслой ис- подслой – Multi-Head self-attention, а второй – полно- пользует остаточное соединение вместе с последу- связная нейронная сеть (Feed Forward). Вокруг каж- ющей нормализацией слоя. Для того, чтобы дого из двух подслоёв используется остаточное предотвратить обращение внимания позиций к после- соединение с последующей нормализацией слоя. дующим позициям, подслой self-attention несколько Выход каждого подслоя выражается формулой (54). модифицируется путем добавления маски. Эта маска, Чтобы упростить эти остаточные соединения, все под- в сочетании с тем фактом, что выходные embedding слои в модели, а также слои embedding (input и output), смещены на одну позицию, гарантирует, что пред- сказания для позиции i могут зависеть только от из- производят выходы размерности ������������������������������������ = 512. вестных выходов в позициях меньше i. ������������������������������������������������������(������ + ������������������������������������������������(������)), (54) Функция внимания может быть описана как отображение запроса и набора пар ключ-значение на где ������������������������������������������������(������) – функция, реализуемая самим под- выход, где запрос, ключи, значения и выход являются слоем. векторами. Выходные данные вычисляются как взвешенная сумма значений, где вес, присвоенный Декодер также состоит из стека N=6 одинаковых каждому значению, вычисляется функцией совме- слоёв. В дополнение к двум подслоям в каждом слое стимости запроса с соответствующим ключом. кодера, декодер добавляет третий подслой, который 17
№ 2 (107) февраль, 2023 г. В архитектуре трансформер используется соб- Слой Multi-Head Attention показан на рисунке 14 ственный слой внимания, названный Scaled Dot- [12]. Multi-Head Attention позволяет модели совместно Product Attention, который показан на рисунке 14. воспринимать информацию из разных подпространств На вход подаются запросы и ключи размерности ������������, представления в разных положениях, описанных а также значения размерности ������������. Сам слой делает формулой (56). следующие последовательные операции: вычисляет скалярное произведение между запросом и клю- ������������������������������������������������������(������, ������, ������) (56) = ������������������������������������(ℎ������������������1, … , ℎ������������������ℎ)������������, чами, делит получившиеся значения на √������������ и при- меняет функцию softmax к результату. где ℎ������������������������ = ������������������������������������������������������(������������������������, ������������������������, ������������������������), ������������������ ∈ ℝ������������������������������������×������������, ������������������ ∈ ℝ������������������������������������×������������, ������������������ ∈ На практике, составляется матрица Q из всех за- просов. Ключи и значения, также упаковываются в ℝ������������������������������������×������������, ������������ ∈ ℝℎ������������×������������������������������������ – матрицы линейных матрицы K и V соответственно, а затем вычисляется преобразований, матрица выходов по формуле (55). h – количество параллельных уровней внимания. ������������������ ������������������������������������������������������(������, ������, ������) = ������������������������������������������ ( ) ������ (55) √������������ Рисунок 14. Scaled Dot-Product Attention (слева) и Multi-Head Attention (справа) В дополнение к подслоям внимания, каждый из преобразования выходных данных декодера в пред- слоев в кодере и декодере содержит полносвязанную сказанные вероятности следующего токена. Оба слоя сеть прямого распространения (FFN), которая при- embedding используют одну и ту же весовую матрицу. меняется к каждой позиции отдельно и идентично. FFN состоит из двух линейных преобразований Поскольку модель не содержит ни рекуррент- с активационной функцией ReLU между ними, что ных, ни сверточных слоев, то, для того чтобы модель описано в формуле (57) с размерностями входного использовала информацию о порядке символов, в последовательности используются «позиционные и выходного векторов ������������������������������������ = 512. Размерность кодировщики» (positional encoding). скрытого слоя FFN равна ������������������ = 2048. 4.13 BERT ������������������(������) = max(0, ������������1 + ������1) ������2 + ������2 (57) Существует два метода использования пред- Подобно другим моделям в трансформере исполь- обученных моделей: извлечение признаков (feature- зуются обученные слои embedding для преобразования based) и дообучение (fine-tuning). Алгоритм BERT входных и выходных токенов в векторы размерно- (Bidirectional Encoder Representations from Trans- сти ������������������������������������. Также используется обычное обученное formers) предлагает улучшенный подход на основе линейное преобразование и функция softmax для дообучения [13]. BERT представляет собой много- уровневый двунаправленный кодер на архитектуре трансформер. 18
№ 2 (107) февраль, 2023 г. BERT использует MLM (masked language model) – В отличие от других способов MLM позволяет обучить в процессе обучения случайные входные токены глубокую двунаправленную сеть на основе архитек- маскируются, таким образом маскированное слово туры трансформер (рисунок 15). предсказывается только исходя из его контекста. Рисунок 15. Архитектура BERT Процесс замены токена на маскировочный токен на двух корпусах: BooksCorpus (800M слов) и англий- [MASK] выглядит следующим образом: случайно вы- ской Википедии (2,500M слов). Процесс дообучения бираются 15% позиций из тренировочных данных, BERT для решения конкретной задачи выглядит затем, если i-ый токен был выбран, то он заменяется следующим образом: к предобученной модели BERT токеном [MASK] в 80% случаев, в 10% случаев он подсоединяются зависящие от задачи входные и вы- заменяется случайным токеном и в оставшихся ходные слои, после чего модель дообучается. 10% случаев он не меняется. Пример модели BERT для задачи классификации BERT работает за два шага: предобучение показан на рисунке 16. (pre-training) и дообучение (fine-tuning). В процессе предобучения BERT обучается без учителя (на нераз- BERT может использоваться для решения различ- меченных данных) на различных задачах. Каждая по- ных задач NLP. Для этого входная последователь- следующая задача имеет свою модель для дообучения ность токенов преобразуется следующим образом: в (входные и выходные слои). BERT предобучается начало последовательности добавляется токен [CLS], обозначающий класс текста, а между предложениями текста добавляется токен [SEP]. Рисунок 16. BERT для решения задачи классификации 19
№ 2 (107) февраль, 2023 г. Заключение метод опорных векторов, градиентный бустинг, многослойный персептрон; В ходе анализа процесса классификации текста рассмотрены основные шаги по классификации • «специальные» алгоритмы: свёрточная нейрон- текста: предобработка текста, извлечение признаков ная сеть, рекуррентная нейронная сеть и сеть, осно- и классификация текста. ванная на трансформерах. Можно разделить рассмотренные в статье алго- «Специальные» алгоритмы отличаются от ритмы классификации на два класса: «универсальных» тем, что могут решать задачи с входными данными определённого вида (в данном • «универсальные» алгоритмы: наивный байе- случае с данными, представляющими собой после- совский классификатор, логистическая регрессия, довательности). Список литературы: 1. Kowsari K., Meimandi K. Jafari., Heidarysafa M. Text Classification Algorithms: A Survey. – URL: https://arxiv.org/abs/1904.08067v5. 2. Mikolov T., Chen K., Corrado G. Efficient estimation of word representations in vector space. – URL: https://arxiv.org/abs/1301.3781. 3. Mikolov T., Sutskever I., Chen K. Distributed representations of words and phrases and their compositionality. – URL: https://arxiv.org/abs/1310.4546. 4. Le V. Quoc, Mikolov T. Distributed Representations of Sentences and Documents. – URL: https://arxiv.org/abs/1405.4053. 5. Pennington J., Socher R., Manning D. Christopher. GloVe: Global Vectors for Word Representation. – URL: https://nlp.stanford.edu/pubs/glove.pdf. 6. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning, 2nd edition. — Springer, 2009. — P. 533. 7. Машинное обучение (курс лекций, К.В.Воронцов). – URL: http://www.machinelearning.ru/wiki/index.php?title=Мо. 8. Sida Wang, Christopher D. Manning. Baselines and Bigrams: Simple, Good Sentiment and Topic Classification. – URL: https://nlp.stanford.edu/pubs/sidaw12_simple_sentiment.pdf. 9. Николенко С. Глубокое обучение. Погружение в мир нейронных сетей. – СПб: Питер, 2018. – С. 480. 10. Levy O., Lee K., FitzGerald N. Long Short-Term Memory as a Dynamically Computed Element-wise Weighted Sum. – URL: https://arxiv.org/abs/1805.03716. 11. Cho K., Merrienboer B., Gulcehre C. Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation. – URL: https://arxiv.org/abs/1406.1078. 12. Vaswani A., Shazeer N., Parmar N. Attention Is All You Need. – URL: https://arxiv.org/abs/1706.03762v5. 13. Delvin J., Chang, Lee K. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. – URL: https://arxiv.org/abs/1810.04805. 20
№ 2 (107) февраль, 2023 г. DOI - 10.32743/UniTech.2023.107.2.14933 МЕТОДЫ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ ИНТЕГРИРОВАННОЙ КОМПЬЮТЕРНОЙ СИСТЕМЫ ЭЛЕКТРОННОГО БИЗНЕСА Мансурова Махина Яшнаровна канд. техн. наук, Ташкентский университет информационных технологий имени Мухаммада аль-Хорезма, Республика Узбекистан, г. Ташкент E-mail: [email protected] METHODS OF MATHEMATICAL MODELING OF THE INTEGRATED COMPUTER SYSTEM OF ELECTRONIC BUSINESS Makhina Mansurova PhD, Tashkent University of Information Technologies named after Muhammad al-Khwarizm, Republic of Uzbekistan, Tashkent АННОТАЦИЯ Данная статья посвящена созданию интеллектуальных автоматизированных систем управления бизнес- процессами, на основе математических моделей. Предложена модель интеллектуального управления бизнес- процессами на основе сравнительного анализа нечетких моделей. А также представлены показатели эффективности бизнес процессов предприятия. ABSTRACT This article is devoted to the creation of intelligent automated systems of business process management, based on mathematical models. It proposes a model of intelligent management of business processes based on a comparative analysis of fuzzy models. And also presented indicators of the effectiveness of business processes of the enterprise. Ключевые слова: автоматизированные системы управления бизнес процессов, бизнес процесс, алгоритм, архитектура, интеллектуальная система, статистическая оценка, метод. Keywords: automated business process management systems, business process, algorithm, architecture, intelligent system, statistical evaluation, method. ________________________________________________________________________________________________ Оценка качества управления БП осуществляется Основной статистический инструмент, используемый построением математической модели, систематизации при этом – контрольные карты. Контрольные карты – сбора и обработки информации. Анализ различных парадигма непрерывного мониторинга процессов на методов применительно для автоматизированных базе числовых данных за счет использования стати- систем управления бизнес процессов (АСУБП), стического управления процессами, который был показывает эффективность использования комп- оформлен доктором Уолтером Шухартом. Принцип лексно статистических методов обработки данных и статистических методов: «Уменьшение вариации нечеткую логику. Без использования статистических (изменчивости) процесса». Чем ниже вариация, тем методов невозможно внедрение процессного подхода лучше процесс; чем лучше процесс, тем стабильнее на желаемом уровне, добиться результатов по повы- качество, чем стабильнее качество, тем выше управ- шению качествапродукциии снижению затрат на нее. ляемость. Мониторинг позволяет определить каче- Такиеметоды, как Кайдзен, TQM (Total Quality ственные характеристики, измерение в свою очередь Management – Всеобщее управление качеством) и позволяет установить количественные показатели. «Шесть сигм» – базируются на статистических ме- Рассмотрим наиболее популярные методы монито- тодах. В современной теории управления одним из ринга процессов: эффективных методов является нечеткая логика, в основе которой лежат нечеткие множества. 1) Инструментальный метод – использование контрольно-измерительного оборудования; Задача статистического управления процессами – обеспечение и поддержание процессов на приемлемом 2) Метод «Опрос» - проведение анкетирования; и стабильном уровне, гарантируя при этом соответ- 3) Метод «Экспертный» - оценивание с помощью ствие продукции и услуг установленным требованиям. специалистов; 4) Статистический метод – преобразование мас- сивов данных. __________________________ Библиографическое описание: Мансурова М.Я. МЕТОДЫ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ ИНТЕГРИ- РОВАННОЙ КОМПЬЮТЕРНОЙ СИСТЕМЫ ЭЛЕКТРОННОГО БИЗНЕСА // Universum: технические науки : электрон. научн. журн. 2023. 2(107). URL: https://7universum.com/ru/tech/archive/item/14933
№ 2 (107) февраль, 2023 г. Инструментальный метод можно использовать образом: «БП – это множество действий, произво- только для процессов производственных, метод димых множеством участников над множеством «Опрос» является социологическим, для получения процессов». В соответствии с этой нотацией, компо- данных от потребителей. зитный БП представляется тройкой: Экспертный метод позволяет получить данные ДТ = {У, Д, Ф}, путем учета мнений специалистов, в качестве кото- рых могут выступать: руководители предприятия, где ДΤ – формальная модель документооборота; ответственные лица за процесс, исполнители процесса У – множество участников; Д – множество действий; и т.д. Данный инструмент менеджмента, предназначен Ф – множество состояний. для постоянного мониторинга и диагностики любых бизнес процессов (БП) предприятия. Предполагается, что все существующие БП электронного бизнеса и те процессы, которые могут Использующийся в классических методах автома- возникнуть в будущем в связи с трансформирова- тизированного управления математический аппарат, нием БП, могут быть представлены системой трех не всегда позволяет полностью удовлетворить требо- множеств. В рамках данной нотации не рассматри- вания современного производства. Поэтому в усло- вается семантика БП, то есть модель является общей виях неопределенности используются следующие и не привязывается к информации, хотя выступает и информационные технологии интеллектуального ее носителем. Отношения между множествами и эле- управления: экспертные системы; нейронные сети; ментами множеств рассмотрены в Приложении 2. нечеткие системы; генетические алгоритмы и ряд других. Описываемая динамическая модель БП пред- ставляет собой множество матриц, каждая из которых Из выше изложенного следует, что при организа- определяет состояние процесса в единицу времени. ции БП наиболее приоритетным подходом являются Под единицей времени будем понимать момент вре- графовые модели. Для построения графовой модели мени между событиями, приводящими к изменению необходимо определить некоторый набор данных, хотя бы одного состояния одного процесса. Пред- которые будут приняты базисом. Для графовой ставление модели в виде совокупности состояний, модели данные должны быть дискретны и предпола- которые могут быть представлены в виде графа, поз- гать связность различной степени. В качестве основы воляют выразить ее реактивность в терминах темпо- для рассматриваемой графовой модели предлагается ральной логики. использовать нотацию. Нотация читается следующим Рисунок 1. Графовая модель бизнес-процессов БП обозначим множеством форм, используемых Дт (V,E,Г) – произведение исходных моделей. в моделируемом процессе. Обозначим эти формы Правила получения произведения моделей Ф1...Ф10. Действия, производимые над БП для Дт(V, E, Г) следующие: смены состояний, обозначим множеством действий 1. Вершинами графа Дт (V, E, Г) является объ- Д1...Д10 . Исполнителей, производящих действия единение вершин исходных графов Дт1(V1, E1, Г1) Д1...Д10, обозначим множеством У1...У10. (рис.1.) и Дт2(V2, E2, Г2), то есть V =V1UV 2 . 2. Отображения для каждой вершины графа Дт Произведение графовых моделей БП записыва- (V, E, Г) определяются Гvi = Г 2{Г1vi}, ется в виде: где Гvi – отображение вершины vi графа Дт (V,E, Г); Гvi – отображение вершины vi графа Дт (V,E, Г ) = Дт1(V1, E1, Г1)× Дт2(V2, E2, Г2), ДΤ1(V1, E1, Г1); Г2{Г1vi} – отображение вершины графа Дт2 для Гvi . где, Дт1(V1, E1, Г1) и Дт2(V2, E2, Г2) – исход- ные модели; 22
№ 2 (107) февраль, 2023 г. На основе методологии построения композит- Сегодня для решения вопросов управления при- ных систем БП представлена графовая модель, кото- меняются интеллектуальные методы на базе рая учитывает декомпозицию потоков на множество нейросетевых технологий и на базе нечеткой ло- участников процесса, состояний и действий. На ос- гики. новании модели, введенной и описанной, возможно построение прикладного программного обеспече- Анализ существующих классификаций показа- ния, которое будет использовать аппарат теории телей эффективности БП предприятия позволил вы- графов для решения практических задач организа- делить два направления их формирования. ции БП [1]. Таблица 1. Показатели эффективности бизнес процессов предприятия Классификация показателей БП предприятия Качественные Y X параметры БП: производительность 1. результативность Показатели продукта показатели качества 2. эффективность 3. адаптируемость Показатели процессов показатели продукта процесса 4. длительность ресурсоёмкость 5. стоимость Количественные показатели БП 1. показатели результативности 2. показатели стоимости 3. показатели времени 4. показатели фрагментации (организационная слож- ность бизнес-процесса, определяемая количеством структурных подразделений и сотрудников компании, участвующих в нём) 1. показатели удовлетворённости клиентов процесса 2. показатели процесса 3. стоимостные показатели 4. показатели времени 5. технические показатели 1. сложность 2. процессность 3. контролируемость 4. регулируемость Сперва выделяется группа показателей в соответ- (Larsen), Такаги-Сугено (Takagi-Sugeno). Ниже пред- ствии с характеристиками процесса (стоимостные ставлен сравнительный анализ нечетких моделей: показатели, показатели времени и др.). Затем опре- деляется группа показателей для оценки различных 1) Модели Мамдани. Модель может быть опре- показателей БП (показатели процесса, показатели делена следующим образом: продукта, показатели ресурсов, показатели удовле- творённости процессом и др.) (Таблица 1.). Система Определение нечеткой базы правил; показателей БП предприятия должна быть построена Фаззификация входных переменных; таким образом, чтобы обеспечивать адекватность их Агрегирование подусловий, для каждого правила оценки. На наш взгляд, она должна сочетать в себе выполняется расчет значений степеней принадлежно- как количественный, так и качественный подход сти. Для расчетов используются правила, где значения к оценке. степеней принадлежности предпосылок не нулевые; Активизация подзаключений в нечетких правилах Искусственные нейронные сети, базирующееся рассчитывается по формуле, учитывая только актив- на алгоритмах обучения и обобщения, позволяют в ные правила; ряде случаев успешно прогнозировать временные Аккумуляция заключений нечетких правил про- ряды, уменьшить требования к математической дукций, где выполняется объединение нечетких подготовке специалистов предметных областей, но множеств и получают итоговое множество нечеткое нейросетевые модели нельзя формально представить, для выходных лингвистических переменных (ЛП); а также невозможно предусмотреть представление При дефаззификации результат приводят к чет- результатов анализа временных рядов. кому представлению, используя метод центра тяже- сти. Наиболее распространение получили методы: 2) Модель Цукамото. Отличие от модели Мам- Мамдани (Mamdani), Цукамото (Tsukamoto), Ларсена дани: 23
№ 2 (107) февраль, 2023 г. Алгоритм прост, но не универсален, так как при- Сугено - линейной комбинацией входных перемен- меняется для монотонных функций соответствия ных. выходных параметров. Применение теории нечеткой логики для анализа Точность ниже, чем алгоритм Мамдани. систем управления БП предприятия дает возможность 3) Модель Ларсена. В отличии от модели Мам- получить принципиально новые модели и методы дани, требует больше операций умножения. анализа данных систем. На основе проведенного 4) Модель Такаги-Сугено. Основное отличие от анализа в качестве основного метода нечеткого вы- модели Мамдани, это задание значений входных пере- вода для построения оптимальной модели интеллек- менных разными способами, которые образуют базу туального управления предлагается применить знаний: в алгоритме Мамдани значения входных алгоритм Мамдани. Структура системы нечеткого переменных задают термами, а в алгоритме Такаги- вывода представлена на рис. 2. Рисунок 2. Структура системы нечеткого вывода решения Целесообразность применения продукционной 2) Приведение к нечеткости (фазификация про- формы представления знаний, накапливаемых в сфере цесса) оценки результативности АСУБП, было подтверждено при разработке модели интеллектуального управле- µ������������������ = 1 (2) ния БП производства с использованием аппарата не- 1+(���������������σ���−2k)2 (3) четкой логики. Применение теории нечеткой логики для анализа систем управления БП дает возможность µ���∗��������� = max µ������������������ , l=4 k=0, l получить принципиально новые модели и методы анализа данных систем [2]. k 1) Нормализация 3) Расчет термов базы знаний ������������������ = ������ ������������������−������������������������������ , ������ = 4 (1) ������������������ = arg µ∗������������ (4) ������������������������������−������������������������������ k 24
№ 2 (107) февраль, 2023 г. 5) Расчет адекватности µ���.��������� = 1 (7) 1+(���������������σ���−2k)2 Методом дефаззификации выбран метод центра тяжести 3) Нечеткий логический вывод – Модель y = ∫mmianx x∗μ(x) (8) Мамдани ∫mmianx μ(x) Если Х11=В и Х12=С … и Х1n=Н Таким образом, обоснована модель интеллекту- ИЛИ Х21=ОВ и Х22=ОН … и Х2n=С ального управления БП производства с использова- ТО Y=B нием аппарата нечеткой логики Мамдани, показаны Далее строится база правил на основе оценок возможности получения количественных оценок в экспертов. Для этого определим степень принад- нечеткой модели АСУБП. Для статистического управ- лежности (СП) экспертных данных (������1(������),������2(������),������(������) ления БП эффективным инструментом являются к каждому из терм-множеств (ТМ). СП ������1(1)к ТМ контрольные карты. На основе проведенного анализа Несоответствия значение «Среднее» = 0.91, к осталь- в качестве основного метода нечеткого вывода для ным областям = 0. Аналогично для ������2(1), СП к ПрО- построения оптимальной модели интеллектуаль- писания Низкое=0.11, к Среднее=0.43, к Высокое=0, ного управления предлагается применить алгоритм для ������(1)СП к Процесс Среднее =0.8, Низкое=Высо- Мамдани. Выполнен анализ и обоснование модели кое=0. Сопоставив экспертные данные ТМ, в которых интеллектуального управления БП с использованием они имеют максимальные СП, записываются следую- аппарата нечеткой логики Мамдани [3]. щее правило: Были выявлены два направления формирования (������1(1),������2(1),������(1)){������1(1)[max:0,91вНесоответствия= БП на основе анализа существующих классификаций Среднее],х2(1)[max:0,41вПрОписани=Среднее], показателей эффективности БП предприятия: выде- ������(1)[max:0,8вПроцесс=Среднее]} (5) ление групп показателей на основе характеристик процесса (стоимостные показатели, показатели вре- Каждому правилу записывается степень истин- мени и др.); определение групп показателей для ности, так как число экспертных оценок высокое, оценки различных элементов БП (показатели про- каждой оценке можно записать 1 правило, при этом цесса, показатели продукта, показатели ресурсов, некоторые могут являться противоречивыми, либо показатели удовлетворённости процессом и др.) дублироваться. Чтобы разрешить данную проблему (Таблица 1). и сократить число правил, каждому правилу запишем степеньистинности (вес правила) и выбираем правило Система показателей БП предприятия должна укоторого выше степень истинности. Для правила быть построена в соответствии с адекватностью их вида (4) степень истинности равна оценки. На наш взгляд, она должна сочетать в себе как количественный, так и качественный подход к СИ=(ПР1)=������������������(������1)∗������������������(������2)∗������������������(������) (6) оценке. Список литературы: 1. Abdul-Azalova M.Ya. Mathematical modelling methods of integrated computerised e-business system //Harvard Educational and Scientific Review. – 2022. – Т. 2. – №. 1. – С. 58-61. 2. Abdul-Azalova M.Ya. Intelligent Management Model Of Business Processes Of Production With The Use Of Fuzzy Logic Apparatus //International Conference on Information Science and Communications Technologies: ICISCT 2021 “Applications, Trends and Opportunities”. – 2021. 3. Muhamediyeva D., Abdul-Azalova M. Application of the theory of fuzzy logic for analysis of management systems of business processes of an enterprise //Scientific Collection «InterConf+». – 2022. – №. 22 (113). – С. 467-471. 25
№ 2 (107) февраль, 2023 г. DOI - 10.32743/UniTech.2023.107.2.15003 РАЗРАБОТКА МАТЕМАТИЧЕСКОЙ МОДЕЛИ ПРОЦЕССА ГИДРООЧИСТКИ ДИЗЕЛЬНОГО ТОПЛИВА Усманов Комил Исроилович ст. преподаватель кафедры «Информатика, автоматизация и управление», Ташкентский химико-технологический институт, Республика Узбекистан, г. Ташкент E-mail: [email protected] Исломова Фарида Камилджановна ст. преподаватель кафедры «Информатика, автоматизация и управление», Ташкентский химико-технологический институт, Республика Узбекистан, г. Ташкент Якубова Ноилахон Собирджановна ст. преподаватель (PhD) кафедры «Система управления и обработка информации», Ташкентский государственный технический университет, Республика Узбекистан, г. Ташкент DEVELOPMENT OF A MATHEMATICAL MODEL OF THE PROCESS OF HYDRO-PURIFICATION OF DIESEL FUEL Komil Usmanov Senior lecturer of department “Informatics, automation and control” of the Tashkent chemical-technological institute, Republic of Uzbekistan, Tashkent Farida Islamova Senior lecturer of department “Informatics, automation and control” of the Tashkent chemical-technological institute, Republic of Uzbekistan, Tashkent Noilakhon Yakubova Senior lecturer(PhD) of department \"Management system and information processing\" Tashkent State Technical University, Republic of Uzbekistan, Tashkent АННОТАЦИЯ В статье предложен системный подход к задачам по математическому моделированию сложного многоста- дийного процесса гидроочистки дизельного топлива. Разработанная кинетическая модель позволяет учитывать стехиометрические зависимости протекающих химических реакций. Модель является основой для получения функциональной зависимости основного показателя качества процесса гидроочистки дизельного топлива. ABSTRACT The article proposes a systematic approach to the problems of mathematical modeling of a complex multi-stage diesel fuel hydrotreatment process. The developed kinetic model makes it possible to take into account the stoichiometric de- pendences of ongoing chemical reactions. The model is the basis for obtaining the functional dependence of the main indicator of the quality of the diesel fuel hydrotreatment process. __________________________ Библиографическое описание: Усманов К.И., Исламова Ф.К., Якубова Н.С. РАЗРАБОТКА МАТЕМАТИЧЕСКОЙ МОДЕЛИ ПРОЦЕССА ГИДРООЧИСТКИ ДИЗЕЛЬНОГО ТОПЛИВА // Universum: технические науки : электрон. научн. журн. 2023. 2(107). URL: https://7universum.com/ru/tech/archive/item/15003
№ 2 (107) февраль, 2023 г. Ключевые слова: системный анализ, математическое моделирование, гидроочистка, дизельное топливо, термодинамика, кинетическая модель, стехиометрическая матрица. Keywords: system analysis, mathematical modeling, hydrotreatment, diesel fuel, thermodynamics, kinetic model, stoichiometric matrix. ________________________________________________________________________________________________ Введение. Одной из наиболее характерных черт является повышение их производительности и каче- современных химических производств является ства выпускаемой продукции. Большая роль в про- стремление к совершенствованию технологий, цессах переработки нефти отводится производству повышению производительности и увеличению еди- дизельного топлива и, в частности, его очистке от ничной мощности агрегатов [4]. Процессы гидро- сернистых соединений при соблюдении требований очистки нефтяных фракций занимают одно из к температуре вспышки [4]. ведущих мест в переработке нефти, что обусловлено высокими требованиями к качеству продукции – ди- Математический модель. В качестве матема- зельным топливам. Основная цель процесса гидро- тической модели процесса гидроочистки дизельного очистки дизельного топлива – снижение содержания топлива будем рассматривать кинетическую модель серы в продукте – гидрогенизате. реакций. Механизмы процесса гидроочистки дизель- ного топлива в настоящее время до конца не изучены, Актуальность проблемы. Одной из основных технологический расчет, как правило, ведется по задач, решаемых на предприятиях нефтепереработки, следующим химическим реакциям [3]: M + H2O ⎯⎯1→УВ + H2S; ДБT + H2 ⎯⎯3→УВ + H2S; ДС + H2 ⎯⎯5→2M; (1) T + 2H2 ⎯⎯2→УВ + H2S; C + H2 ⎯⎯4→M +УВ; БT + 2H2 ⎯⎯6→C; Для математической формализации процесса введем следующие обозначения [5]: x1 − М – меркаптаны; x6 − ДБТ – дибензотиофены; (2) x2 − C – сульфиды; x7 −УВ – углеводороды; x3 − ДС – дисульфиды; x8 − H2 – водород; x4 − Т – тиофены; x9 − H2S – сероводород. x5 − БТ – бензотиофены; С учетом обозначений (2) химические реакции (1) примут следующий вид: x1 + x8 → x7 + x9 x6 + x8 → x7 + x9 x3 + x8 → 2x1 (3) x4 + 2x8 → x7 + x9 x2 + x8 → x1 + x7 x5 + 2x8 → x2 Матрица стехиометрических коэффициентов ij ,i = 1,9, j = 1,4, соответствующая кинетическим уравнениям, представлена в таблица 1. Матрица стехиометрических коэффициентов Таблица 1. М C ДС Т БТ ДБТ УВ H 2 H2S –1 1 1 –1 0 0 0 0 0 1 –2 1 1 –1 1 2 0 0 0 –1 0 0 1 –1 0 1 –1 0 3 0 0 0 0 0 –1 0 –1 0 0 4 1 –1 0 0 0 0 5 2 0 –1 0 0 0 6 0 1 0 0 –1 0 27
№ 2 (107) февраль, 2023 г. Полученная матрица является матрицей стехио- где k0 – предэкспоненциальный множитель; метрических коэффициентов, которая формально E – энергия активации стадии, (кал/моль); T – абсо- представляет собой скорость изменения компонентов лютная температура, К; R – универсальная газовая химической реакции [7; 8]. Согласно закону действую- постоянная (кал/(моль·К)). щих масс и матрицы стехиометрических коэффи- циентов (табл. 1), кинетические уравнения, Среди компонентов химической реакции любой соответствующие схеме химических превращений (3), сложности можно выделить ключевые и не ключевые. для процесса гидроочистки дизельного топлива можно Число ключевых компонентов химической реакции выразить уравнениями [7]: равно рангу матрицы стехиометрических коэффици- ентов. Поскольку ранг стехиометрической матрицы 1 = k1Cx1Cx8; 2 = k2Cx4 Cх28; (табл. 1) равен 4, то это означает, что количество 3 = k3Cx6Cx8; ключевых компонентов [5; 7] для химической реак- 5 = k5Cx3Cx8; 4 = k4Cx2Cx8; ции (2) равно 4. 6 = k6Cx C2 ; Кинетическая модель процесса является основой для построения компьютерной моделирующей си- 5 х8 стемы для расчета и прогнозирования оптимального технологического режима работы реактора гидро- Здесь, Cxi − вектор мольных концентраций ве- очистки дизельного топлива. ществ, моль/м3; k1 − k6 – константы скоростей (сек–1) Результаты и их обсуждение. Для решения этой задачи с помощью программной среды MatLab химической реакции соответствующего направления, нужно разработать вычислительно-имитационную определяющегося уравнением Аррениуса [3; 7]: модель процесса [6; 2] (рис.1), характеризующую характер изменения концентрации компонентов по = k0e −E времени. k RT , Рисунок 1. Компьютерная модель процесса гидроочистки дизельного топлива Задавая начальные условые для переменных в соответствии с технологическим регламентом для стационарного режима, получим графики [6] изме- нения компонентов. 28
№ 2 (107) февраль, 2023 г. Рисунок 2. Переходные процессы распределения концентрации веществ процесса гидроочистки дизельного топлива Выводы. Использование расмотренной матема- 2) обеспечить необходимую концентрацию жид- тической модели в составе системы управления техно- кости, насыщенной водородом; логическими процессами гидроочистки дизельного топлива позволяет: 3) определить необходимый температурный режим по всей длине реактора. 1) снизить потери количества используемого водорода в процессе гидроочистки дизельного топ- лива; Список литературы: 1. Адаптивно нечеткое синергетическое управление многомерных нелинейных динамических объектов / К.И. Усманов [и др.] // Universum: технические науки: электрон. научн. журн. – 2020. – № 3 (72) / [Электронный ресурс]. – Режим доступа: URL: https://7universum.com/ru/tech/archive/item/9016. 2. Акрамхужаев Й.Т., Усманов К.И., Сокиева К.У.К. Анализ систем управления нелинейного динамического объекта // Universum: технические науки. – 2021. – № 5-1 (86). – С. 41–45. 3. Афанасенко А.Г., Гнатенко Ю.А. Математическая модель и оптимизация процесса карбонизации аммонизированного рассола // Математическое моделирование. – 2008. – Т. 20, № 9. – С. 105–110. 4. Борзов А.Н. Моделирование и управление процессом гидроочистки дизельного топлива : дис. – Санкт-Петербургский государственный технологический институт, 2005. 5. Разработка кинетической модели процесса гидроочистки дизельного топлива / Ю.И. Афанасьева [и др.] // Известия Томского политехнического университета. Инжиниринг георесурсов. – 2012. – Т. 321, № 3. – С. 121–125. 6. Fuzzy synergetic control nonlinear dynamic objects / I. Sidikov [et al.] // Karakalpak Scientific Journal. – 2020. – Т. 3, № 2. – С. 14–22. 7. Siddikov I., Usmanov K., Yakubova N. Synergetic control of nonlinear dynamic objects // Chemical Technology, Control and Management. – 2020. – Т. 2020, № 2. – P. 49–55. 8. Sidikov I.H., Usmanov K.I., Yakubova N.S. Nochiziqli dinamik obyektlarni sinergetik boshqarish usulidan foydala- nib sintezlash // Muxammad al-Xorazmiy avlodlari, Ilmiy-amaliy va axborot-tahliliy jurnal. – 2020. – № 1. – P. 11. 29
№ 2 (107) февраль, 2023 г. МАШИНОСТРОЕНИЕ И МАШИНОВЕДЕНИЕ DOI - 10.32743/UniTech.2023.107.2.15018 ФАКТОРЫ РЕЖИМА ДЕФОРМИРОВАНИЯ Махмудова Наргиза Абдунабиевна доц. кафедры “Обработка металлов давлением” Ташкентского государственного технического университета, Республика Узбекистан, г. Ташкент E-mail: [email protected] Ибодуллаев Тўйчи Неъмат огли ст. преподаватель кафедры “Обработка металлов давлением” Ташкентского государственного технического университета, Республика Узбекистан, г. Ташкент FACTORS OF THE DEFORMATION MODE Nargiza Makhmudova Associate Professor of the Department of Metal Forming, Tashkent State Technical University, Republic of Uzbekistan, Tashkent Tuychi Ibodullaev Senior Lecturer of the Department of Metal Forming, Tashkent State Technical University, Republic of Uzbekistan, Tashkent АННОТАЦИЯ В статье рассмотрен процесс биллетировки предшествующей операции осадки заготовки для штампа. Влияние инструмента и рассмотренных технологических параметров на напряженно-деформированное состояние в металле при ковке слитков. Капитальный ремонт штампов. ABSTRACT The article considers the process of billeting the previous operation of upsetting a workpiece for a stamp. Influence of the tool and considered technological parameters on the stress-strain state in the metal during forging ingots. Overhaul of stamps. Ключевые слова: штамп, слиток, пресс, поковка, заготовка, проковка. Keywords: stamp, ingot, press, forging, billet, forging. ________________________________________________________________________________________________ Основную долю металла для машиностроения де- Изменение свойств пластичности в интервале темпе- формируют в нагретом состоянии. В кузнечно – прес- совые цехи, как правило, слитки поступают из ратур 1100-12000С для сталей названных классов прак- сталеплавильного цеха при температуре их поверхно- сти не ниже 6500С. В большинстве процессов горячей тически ничтожно, т.е. технологически допустимый обработки металлов давлением предусматривают рав- номерный нагрев слитков и заготовок, что достигают температурный перепад обеспечивает равномерное со- за счет выдержки при температуре нагрева. Техноло- гически допустимым перепадом температуры по сече- противление деформации металла по сечению заго- нию слитка считают 50-1000С для конструкционных углеродистых и легированных сталей и 30-400С для товки. сталей высокоуглеродистых и высоколегированных. При первом нагреве металла температуру ограни- чивают с целью предотвращения пережога и назна- чают на 150-2000С ниже линии солидуса по диаграмме железо – углерод. Заканчивают деформирование при температуре не выше Ас3 +(20 ÷ 800С). Температуру нагрева металла назначают в зависимости от величины __________________________ Библиографическое описание: Махмудова Н.А., Ибодуллаев Т.Н. ФАКТОРЫ РЕЖИМА ДЕФОРМИРОВАНИЯ // Universum: технические науки : электрон. научн. журн. 2023. 2(107). URL: https://7universum.com/ru/tech/archive/item/15018
№ 2 (107) февраль, 2023 г. накопленной деформации, а минимальную деформа- виду, что осадка может быть лишней, а иногда и вред- цию устанавливают в зависимости от температуры ре- ней операцией. Применение осадки связано со значи- кристаллизации. Термомеханические условия тельным увеличением трудоемкости, снижением деформации определяют размер зерна стали, являю- производительности и увеличением мощности обору- щейся одной из важнейших характеристик качества дования. В связи с этим осадку в качестве промежуточ- деформированных изделий. При малых деформациях ной операции (в целях повышения пластичности и на отделочных операциях металл нагревают до невы- вязкости металла) целесообразно применять тогда, ко- сокой температуры (900-10500С), чем обеспечивают гда для поковки не обеспечивается уковка, равная 2. незначительный рост зерна при нагреве. Но если на по- следней операции деформирования предусмотрена Закрытие внутренних дефектов слитка при осадке уковка не менее 1,5 , то температуру нагрева можно значительно зависит от схемы напряженно-деформи- назначить до 12000С. Исследованиями было показано, рованного состояния, а также от распределения пото- что для большинства углеродистых и конструкцион- ков металла, особенно в месте расположения дефекта. ных сталей допустим нагрев до 1200-12500С даже без Для свободной ковки наиболее характерна осадка последующей деформации, если заготовки потом под- слитков с H/D=1,5÷2,6. В этом диапазоне размеров вергают термообработке с перекристаллизацией. H/D неравномерность деформации, обусловленная также трением на контактных поверхностях и формой С точки зрения проковки металла операция билле- осадочных плит, увеличивается по мере уменьшение тировки наименее производительна, и для ее выполне- отношения H/D. Влияние степени осадка на распреде- ния обычно необходим нагрев слитка. Принято ление деформации поэтому также связано с сопутству- считать, что биллетировка слитков способствует за- ющим изменением соотношения размеров H/D. варке газовых пузырей и других подкорковых дефек- тов слитка, созданию пластичного поверхностного По мере осадки наиболее интенсивно металл де- слоя металла, благоприятно влияющего на дальнейшее формируется лишь в средней зоне, составляющей не протекание ковки и в особенности операции осадки. более 30% высоты заготовки. В тоже время в прикон- При неудовлетворительном качестве поверхности тактных зонах деформация металла значительно стальных слитков операция биллетировки обяза- меньше. В соответствии с распределением деформа- тельна, независимо от марки стали, как важнейший цией происходит и закрытие дефектов. Для закрытия фактор предупреждения развития пороков в крупные крупных дефектов при осадке достаточна уковка 3, но поверхностные дефекты. На некоторых заводах можно необходимо, чтобы соотношение размеров заготовки наблюдать осадку небиллетированных слитков, в ос- было более 4, так как несплошности в при контактных новном из углеродистых сталей. Устранение биллети- зонах не устраняются даже при уковке, разной 3. При- ровки позволяет увеличить производительность ковки менение осадки большой степени как промежуточной на 10%. Исследования и заводской опыт показали, что операции может отрицательно сказаться на качестве биллетировка – операция необходимая [1]. поковок, так как с ростом диаметра осаженного блока уменьшается величина относительной подачи при по- Биллетировка предшествует операции осадки. следующей протяжке и в осевой зоне заготовки могут Применение осадки в качестве промежуточной опера- появиться растягивающие напряжения. В процессе ции в процессе изготовления поковок вызвано, что осадки внутренние слои металла испытывают нерав- только протяжкой слитка с небольшим уковом нельзя номерное объемное сжатие, а вблизи боковой поверх- обеспечить высокий уровень механических свойств ности появляются растягивающие напряжения, металла, так же как нельзя получить поковки, размер причем наряду с тангенциальными растягивающими сечения которых больше сечения слитка. Существует напряжениями действуют и радиальные напряжения мнение, что осадка способствует улучшению качества того же знака. поковки, размер сечения которых больше сечения слитка. Существует мнение, что осадка способствует Многочисленные промышленные эксперименты улучшению качества поковок, повышению пластично- показывают, что применение промежуточной осадки сти и вязкости металла в результате раздробления ли- для повышения механических свойств на поковках той структуры, измельчения дендритов. В связи с этим типа валов нецелесообразно, если при последующей при изготовлении особо ответственных поковок, к ме- протяжке может быть получена уковка не менее 2,5, ханическим свойствам которых предъявляют повы- так как она обеспечивает примерно такие же свойства шенные требования, нередко применяют две или даже на образцах, ориентированных в продольном и попе- три промежуточные осадки. речном направлениях, как уковка 4-5 при протяжке осаженного блока. Кроме того, увеличение уковки по- Осадку считают основной операцией, во время ко- сле осадки даже повышает склонность стали к шифер- торой обеспечивают заковку внутренних несплошно- ному излому. стей. Принято считать, что закрытие дефектов происходит при осадке на 50% и более. Однако при Если биллетировка и осадка являются вспомога- этом имеет значение соотношение размеров заготовки. тельными и промежуточными операциями при изго- Если осадку заканчивают при отношении H/D >1, товлении поковок типа валов, то протяжка служит то повышение плотности металла и заваривание внут- основной операцией. В отличие от осадки, то протяжка ренних дефектов происходят не полностью. служит основной операцией. В отличие от осадки, осу- ществляемой при полном перекрытии заготовки ин- Осадка необходима в том случае, когда у металла струментом, протяжка состоит из некоторого числа поковки требуются повышенные свойства в попе- чередующихся единичных обжатий и кантовок при речно-ориентированных образцах. Но следует иметь в наличии одной или двух внешних необжимаемых зон. 31