бесплатно рефераты
 

Автоматизация процессов документооборота

p align="left">С документами любого содержания необходимо выполнять некоторые действия: принимать и отправлять, регистрировать, передавать по назначению, контролировать ход исполнения, накладывать резолюции. Специализированные системы (а практически все отечественные разработки в этом сегменте относятся к данному классу) как раз и предназначены для решения таких задач, например для автоматизации делопроизводственной деятельности предприятия.

Корпоративные системы управления документами - это, по сути, платформы для создания различных решений, ориентированных на обработку документов. Специализированные решения, в свою очередь, ориентированы на решение конкретных задач, таких как автоматизация традиционного отечественного делопроизводства, и внедряются они на ограниченном числе рабочих мест. При этом специализированные системы не предназначены для решения задач, связанных с содержательной частью документа. [16]

1.2 Распознавание образов как неотъемлемый этап работы в системе электронного документооборота (СЭД)

Сегодня перспективные разработки построения систем управления информацией в электронном виде связаны с распознаванием образов. В начале 90-х гг. появились технологические разработки, связанные с индексацией и поиском документов, в которых используются результаты, полученные в области искусственного интеллекта и нейронных сетей. [16]

С помощью возможностей распознавания компьютер сможет «прочесть» отсканированный текст. А затем воссоздать первоначальный вид страницы со всеми имеющимися графическими элементами в электронном виде. Использование распознавания текста после сканирования печатного издания позволяет не только обеспечить доступ к нему широкого круга лиц, но и сохранить редкий экземпляр документа. Современные технологии позволяют решить проблему разрушения бумаги при частом использовании. Это подразумевает, что теперь материалы, хранящиеся в архивах, фондах, библиотеках и редких коллекциях, могут быть активно использованы за счет электронных дубликатов.

В чистом виде такая возможность может быть полезна для:

сохранения уже имеющейся на бумажном носителе информации в электронном виде;

быстрого поиска необходимой информации;

удобства пользования информацией, представленной в электронном виде для большого количества одновременно работающих пользователей.

Распознавание текста позволяет увеличить удобство работы с информацией за счет преобразования данных на отсканированном изображении в удобные форматы текстовых редакторов (doc, pdf и т.п.). Таким образом, появляется возможность модифицировать полученный текст, использовать его в своих документах. Печатать, а также осуществлять контекстный поиск.

Работы по распознаванию отсканированного текста можно подразделить на несколько этапов:

Распознавание структуры документа. С помощью специального программного обеспечения производится распознавание структуры документа. Стоит отметить, что современное ПО имеет режим автоматического определения типа, размера и структуры фрагментов изображения (текст, таблица, рисунок), но опыт свидетельствует, что необходимо обязательно проверять правильность определения фрагментов и проводить их корректировку.

Распознавание текста. На этом этапе особенно важно правильно установить параметры программы, чтобы минимизировать ошибки распознавания. Количество ошибок распознавания зависит от таких параметров, как полиграфическое качество документа, размер и контрастность текста, сложность взаимного размещения элементов документа.

Проверка правильности распознавания. С помощью встроенных средств производится визуальная проверка соответствия неуверенно распознанных символов.

Проверка орфографических ошибок. С помощью 2 этапа, как правило, не удается от всех ошибок, поэтому необходимо также проводить проверку орфографии, например, встроенными средствами Microsoft Word.

Форматирование и оформление результирующего документа. На этом этапе формируется результирующий документ (как правило, в Microsoft Word). Устанавливаются единообразные значения параметром шрифта и абзацев. Производится размещение и формирование таблиц. Осуществляется ручной дополнительный ввод текста, формул, таблиц, автоматизированное распознавание которых не удалось произвести. Фактически, можно добиться практически полной схожести результата с исходником, включая параметры шрифтов и верстку документа.

Общее название программ для распознавания текста - Optical Character Recognition (OCR). Сейчас на рынке представлено несколько десятков подобных специализированных программных продуктов и среди них российские версии занимают одни из ведущих позиций.

Программы OCR «низкого уровня» переводят текст на бумаге в набор символов и далее предлагают самостоятельно разобраться с тем, что получилось. Для простых текстовых документов это вполне приемлемый уровень. Но если документ, который находится на сканере, имеет сложную структуру (с графическими вставками или таблицами и пр.), то такая программа сделает столько ошибок, что неизвестно, что проще - набирать текст вручную или редактировать то, что выдал сканер. [6]

Профессиональная программа OC, с помощью которой сканер сможет распознать не только символы, но и структуру документа, «понимает», где находится графика, где простой текст, где таблица. И, соответственно, делит документы на фрагменты, а каждый фрагмент согласно его свойствам вставляет в конечный файл. Разумеется, график или чертеж программа не трогает вовсе - «понимает», что здесь нечего распознавать. Она пытается восстановить таблицы именно той структуры, какой они были в оригинальном документе (с таким же распределением ячеек по столбцам и строкам).

Основное назначение OCR-систем состоит в анализе отсканированного знака и присвоении фрагменту изображения соответствующего символа. Большинство программ оптического распознавания текста работают с изображением, которое получено через факс-модем, сканер или другое внешнее устройство, например, фотоаппарат. Сначала OCR должен разбить страницу на блоки текста, основываясь на особенностях правого и левого выравнивая и наличия нескольких колонок. Затем распознанный блок разбивается на строки, которые делятся на непрерывные области изображения, соответствующего отдельным буквам.

Алгоритм распознавания делает предположения относительно совпадения этих областей с символами, а затем происходит выбор каждого символа, в результате чего страница восстанавливается в символах текста, причем, как правило, в соответствующем формате. OCR-системы могут достигать наилучшей точности распознавания свыше 99,9% для чистых изображений, составленных из обычных шрифтов. На первый взгляд такая точность распознавания кажется идеальной, но уровень ошибок все же удручает, потому если имеется приблизительно 1500 символов на странице, то даже при коэффициенте успешного распознавания 99,9% получается одна или две ошибки на страницу. В таких случаях на помощь приходит метод проверки по словарю. То есть, если какого-то слова нет в словаре системы, то она по специальным правилам пытается найти похожее. Но это все равно не позволяет исправлять 100% ошибок, что требует человеческого контроля результатов.

Ускорить проверку результата и сделать ее более надежной пользователю поможет встроенная программа проверки орфографии.

После завершения процесса распознавания OCR-системы сохраняют формат исходных документов, присваивают в нужном месте атрибуты абзаца, сохраняют таблицы, графику и т.д. Современные программы распознавания поддерживают все известные текстовые и графические форматы и форматы электронных таблиц, а некоторые поддерживают такие форматы, как HTML и PDF. [6]

Современную OCR-систему отличают:

отличное качество распознавания и точное сохранение оформления;

документ анализируется и обрабатывается целиком, что позволяет понять такие элементы его внутренней структуры, как верхние и нижние колонтитулы, сноски, подписи к картинкам и диаграммам, стили, шрифты и т.д.;

распознавание многоязычных документов (система может работать с документами на 184 языках);

распознавание цифровых фотографий документов (сейчас для распознавания необязательно оснащать компьютер сканером). Система распознавания позволяет распознавать фотографии документов, сделанные цифровой камерой. Рекомендуется использовать цифровой фотоаппарат с разрешением матрицы 4 Мпикс и выше;

распознавание гиперссылок (OCR-система находит в тексте ссылки на веб-сайты, адреса электронной почты, файлы и воспроизводит их в выходных документах;

сохранение результатов (программа легко и быстро экспортирует результаты распознавания в популярные офисные приложения. Среди них Microsoft Word, Microsoft Excel, Microsoft PowerPoint, Lotus Word Pro, Corel WordPerfect, OpenOffice);

большой выбор форматов сохранения (распознанный текст можно сохранить в различных форматах: PDF, PDF/A, DOCX, XLSX, RTF, DOC. XLS, CSV, TXT, HTML, DBF и др.);

Исследования, проведенные среди пользователей, показали, что при работе с OCR-системой важными являются следующие параметры:

точность распознавания - 95%;

точность сохранения оформления в документах для текстовых процессоров (в форматах MS Word, MS Excel, Word Pro, Word Perfect) - 89%;

точность сохранения оформления для последующей электронной публикации (в форматах PDF, HTML) - 87%;

работа с таблицами и многоколоночными текстами - 87%;

простота использования - 85%;

надёжность работы - 82%;

удобный поиск ошибок и сверка с оригиналом - 80%;

работа с цветом (сохранение цветных картинок и цвета шрифта, фона) - 63%;

прямой экспорт в другие приложения - 61%;

скорость - 55%;

многоязычное распознавание - 25%.

Работа с современными OCR-системами, как правило, не вызывает особых затруднений. Большинство таких систем имеют простейший автоматический режим «Сканируй и распознавай» (Scan&Read). Весь процесс переноса текста с бумаги на компьютер (от сканирования до сохранения результата) займет меньше одной минуты (время зависит от документа, возможностей используемого компьютера и сканера). И «электронный» документ будет выглядеть точно так же, как бумажный оригинал. [6]

Но перевод документов в электронный вид в графическом формате - это только часть процесса. Данные из электронной копии еще нужно ввести в информационную систему, а саму копию документа пока довольно трудно найти, пусть даже и в электронном архиве. [17]

1.3 Жизненный цикл документа

На рынке сейчас представлен достаточно широкий спектр таких программных решений, каждое из которых чем-то, но отличается от других. Как разобраться в этой пестроте? Одна из характеристик, особенно важная для секретаря или делопроизводителя, который будет работать в такой системе - какие этап жизненного цикла документа автоматизирует конкретная система.

Что такое - жизненный цикл документа? Любой документ вне зависимости от его структуры или содержания проходит ряд стадий, которые в целом называются «жизненным циклом документа». Все документы проходят через пять основных этапов жизненного цикла (некоторые этапы могут повторяться, а некоторые имеют место только один раз):

1) документы создаются;

2) они рецензируются и исправляются:

3) формально или неформально утверждаются;

4) распространяются или публикуются для более широкой аудитории;

5) они выполняют свою основную функцию и попадают в архив;

6) при необходимости извлекаются из архива, а затем снова архивируются.

Но в учебниках по делопроизводству такого понятия нет. Есть понятие «документооборот» - движение документов в организации с момента их создания или получения до завершения исполнения или отправки. Выделяют следующие этапы технологической цепочки обработки документов:

прием и первичная обработка;

предварительное рассмотрение и распределение;

регистрация документов;

направление на исполнение и исполнение, документов;

оформление и удостоверение документов; отправка.

Отдельно как задачи делопроизводства рассматриваются вопросы контроля исполнения и хранения документов. Получается, что делопроизводство описывает только часть этапов жизненного цикла документа: ту, в рамках которой с ним работает делопроизводитель.

В системах электронного документооборота с документами работают все сотрудники, кому по роду деятельности это необходимо. Это руководители, которым нужно прочитать письмо и решить, что делать с ним дальше, исполнители, которые работают по выполнению резолюции, готовят ответные письма. В целом это может быть любой сотрудник организации, которому нужна информация по документам, по их содержанию, назначенным исполнителям, срокам исполнения и т.д.

В делопроизводстве принято выделять группы документов - входящие, исходящие, внутренние, организационно-распорядительные. При работе в системе электронного документооборота такое деление, как правило, остается.

В качестве примера сделаем описание работы в системе электронного документооборота с каким-нибудь типом документа, например - входящим.

Документ создается (чтобы документ стал входящим, он конечно должен быть создан, но происходит это где-то там, в другой организации), рецензируется, утверждается и распространяется (на этом этапе документ попадает в организацию).

На этапе создания (в данном случае получения документа системой электронного документооборота из внешних систем) требуется выполнение наиболее трудоемкой части работы по занесению информации о документе в систему электронного документооборота.

Работа эта состоит из двух частей:

1) ввод реквизитов документа;

2) ввод образа документа.

Ввод реквизитов документа похож на процесс составления регистрационно-контрольной карточки документа. Эту операцию выполняют, как правило, все системы электронного документооборота, но не все могут хранить электронный образ документа.

Далее документу присваивается регистрационный номер. На документ накладывается резолюция, назначаются ответственные за его исполнение, прописывается срок исполнения. Выполняет выдачу резолюции ее автор резолюции. Но бывают ситуации, когда он не может (или не хочет) это делать. Тогда на плечи секретаря ложится работа по занесению в систему резолюции, выполненной автором в традиционном - «бумажном» - формате. Следующим этапом обработки документа является создание отчета о его исполнении (отметки об исполнении). Гораздо удобнее, если можно сделать не просто пометку «выполнено такого-то числа», а иметь возможность оставить комментарий, сохранить файл, который будет являться подтверждением, что документ действительно исполнен.

Данная операция может быть разбита на две части:

* отчет самого исполнителя;

* отметка руководителя о том, что результат его устраивает.

Кто конкретно внесет информацию об этих операциях в систему? Все зависит от того, как организована работа. Варианты могут быть самыми разными: это может быть и исполнитель, и автор резолюции, данные функции также могут быть делегированы делопроизводителю. При изучении системы электронного документооборота на эти операции следует обратить особое внимание. Лучше, когда сами исполнители вносят информацию об исполнении - это разгружает службу делопроизводства.

Кроме того, дополнительные возможности систем электронного документооборота (сортировка документов на выполненные и невыполненные, автоматическая рассылка системой уведомлений о приближении срока выполнения документа) позволяют поднять исполнительскую дисциплину среди сотрудников.

Наступление этапа «передача в архив» совсем не обозначает, что документ стал ненужным. Необходимо организовать хранение так, чтобы документ можно было легко найти и получить нужную информацию. Как правило, для этого используют номенклатуру дел.

На этом этапе могут понадобиться операции контроля исполнения документов. Позволяет ли система составлять отчеты по статистике исполнения документа, насколько это удобно, есть ли возможность создавать собственные отчеты. [11]

1.4 Согласование документов в СЭД

Одним из этапов жизненного цикла документа является его согласование, когда документ уходит от автора, и до вступления его в законную силу с ним знакомятся, высказывают свое мнение и спорят заинтересованные стороны.

Если рассмотреть жизненный цикл документа с учетом количества людей, работающих с ним на каждой стадии, получится следующий график. (рис. 7)

Наибольшее количество людей работают с документами на стадии согласования. Процесс согласования - одна из самых трудоемких стадий при подготовке документа.

Рисунок 7 - График жизненного цикла документа

Как правило, в ней участвует несколько служб, и работа с документом каждой из них занимает определенное время. А общее время на согласование документа может стать весьма продолжительным, учитывая, что циклов согласования иногда приходится выполнять несколько.

Задержки при передаче документа от одной службы к другой еще более затягивают процесс. А если о документе невзначай забывают в какой-нибудь службе, процесс просто встает, и требуется приложить усилия, чтобы понять, где же документ находится.

Для решения этих проблем системы электронного документооборота предлагают возможность совместной подготовки и согласования документов. Стоит отметить, что эти процессы похожи, но реализуются по-разному.

При согласовании документа, содержание его не изменяется. Участники согласования высказывают свои замечания («Согласен», «Не согласен», «Особое мнение») вне текста документа. Итогом является исходный текст документа, а также набор мнений и замечаний согласовывающих сторон. Инициатор согласования сам вносит все изменения в текст документа и, при необходимости, может оправить документ на повторное согласование.

Сложность согласования заключается в разнообразии маршрутов прохождения документов и ситуаций поведения участников этого процесса. Например, согласование может идти как независимо от порядка участников, так и в строгом с ним соответствии. Процесс согласования может как доводиться до конца вне зависимости от мнений его участников, так и приостанавливаться в случае, если кто-то выскажет свое несогласие.

При разработке маршрутов согласования документов в системе электронного документооборота Company Media, используется специальный конструктор.

Так, с помощью конструктора пользователь системы может выбирать параметры согласования: параллельное, последовательное, комбинированное.

Как «работает» параллельное согласование? При работе в СЭД, реального движения документа не происходит. Он «лежит» в базе данных на сервере, поэтому эксперты, включенные в лист согласования, одновременно получают доступ к документу и могут независимо друг от друга работать с ним. Сигналом к началу работы является получение участником согласования уведомления, которое поступает по электронной почте. Оно содержит стандартный текст, информирующий получателя о том, что он назначен участником процесса согласований. Открыв уведомление, пользователь по ссылке может «перейти» на сам документ.

При последовательном согласовании, доступ к документу по очереди получают эксперты, включенные в список согласующих Последовательное согласование при необходимости можно настроить сложным образом: указать длительность каждого этапа согласования (и сделать их разными), «прописать», что именно делать в случае, когда срок согласования прошел, а виза не получена. [14]

«Конструктор» предлагает такие варианты действий:

ничего не делать;

продолжить процесс;

однократно уведомить инициатора о просроченном согласовании и продолжить процесс;

приостановить согласование и наладить процесс периодического уведомления визирующего и инициатора.

Если один из согласующих не согласен, «конструктор» предлагает такие варианты реакции:

уведомить инициатора и продолжить процесс;

продолжить процесс без уведомлений;

уведомить инициатора и остановить процесс.

Когда лист согласования готов, инициатор нажимает кнопку

Экономия времени при согласовании документа в системе достигается за счет увеличения скорости его перемещения от одного участника к другому. От инициатора согласования требуется гораздо меньше усилий и времени, чтобы контролировать данный процесс. Кроме того, эксплуатация системы позволит соблюсти жесткие сроки подготовки документов. [14]

1.5 Работа с шаблоном документа

Для экономии времени в СЭД реализован такой сервис, как создание документа по шаблону. Шаблон - это заготовка определенного вида документа, в которую можно включить все повторяющиеся элементы.

Страницы: 1, 2, 3, 4, 5


ИНТЕРЕСНОЕ



© 2009 Все права защищены.