Семинар 2 Аппаратные и программные средства создания электронных документов

Лекция –Семинар 2_6. Аппаратные и программные средства
создания электронных документов.



Содержание темы: Электронные тексты. Системы оптического считывания и распознавания текстов и таблиц (Spot, FineReader и пр.). Оптические сканеры. Технические и программные средства создания и обработки изображений (PhotoShop; CorelDraw и др.). Понятие гипертекста и гипермедиа. Принципы функционирования. Информационные и функциональные возможности мультимедиа-технологии. Основные принципы функционирования мультимедийных программ. Программное обеспечение для разработки мультимедийных продуктов. Программы подготовки “исходных” материалов для мультимедиа-разработок. Примеры мультимедиа-продуктов.

Электронный текст

- вид материалов, представленных в электронном виде как неинтерактивные тексты с иллюстрациями и имеющих линейную структуру логически и методически организованного текста, которая соответствует структуре "классического" печатного издания.

Задача распознавания текстовой информации при переводе печатного и рукописного текста в машинные коды является одной из важнейших составляющих проектов, имеющих целью автоматизацию документооборота.

В последние десятилетия, благодаря использованию  современных достижений компьютерных технологий, были развиты новые методы обработки изображений и распознавания образов, благодаря чему стало возможным создание таких систем распознавания печатного текста, которые удовлетворяли бы основным требованиям систем автоматизации документооборота.

Различные технологии, объединенные под общим термином "распознавание символов", подразделяются на распознавание в реальном режиме времени и распознавание в пакетном режиме, каждый из которых характеризуется собственной аппаратной частью и собственными алгоритмами распознавания.

В типичной системе оптического распознавания текстов (OCR - Optical Character Recognition) вводимые символы читаются и оцифровываются оптическим сканером. Данные могут быть любого рода: книга, газета, журнал, факс - любой документ, содержащий текст, который надо перенести в компьютер.

После этого каждый символ подвергается локализации и выделению, и получившаяся матрица подвергается предобработке, т. е. сглаживанию, фильтрации и нормализации. В результате предобработки выделяются характерные признаки, после чего производится классификация.

Существует ряд существенных проблем, связанных с распознаванием рукописных и печатных символов. Наиболее важные из них следующие:


Как правило, системы OCR состоят из нескольких блоков, предполагающих аппаратную или программную реализацию:

В результате работы оптического сканера исходный текст вводится в компьютер в виде полутонового или бинарного изображения.

После разбиения символы, представленные в виде бинарных матриц, подвергаются сглаживанию, фильтрации с целью устранения шумов, нормализации размера, а также другим преобразованиям с целью выделения признаков, используемых впоследствии для распознавания.

Распознавание символов происходит в процессе сравнения выделенных характерных признаков с эталонными признаками, отбираемыми в ходе статистического анализа результатов, полученных в процессе обучения системы.

Таким образом, смысловая или контекстная информация может быть использована как для разрешения неопределенностей, возникающих при распознавании символов, обладающих идентичными размерами, так и для корректировки слов и фраз в целом.

Одна из наиболее ранних попыток создать систему, способную считывать тексты, была предпринята в 1870 году. Она представляла собой сканер-сетчатку, работа которого была основана на фотоэлементах. В дальнейшем появились Fourier d'Albe's Optophone в 1912 г. и Thomas tactile relief device в 1926 г. Системы оптического считывания текстов появились в середине XXв. в результате развития цифровых компьютеров. Дэвид Шепард, основатель компании Intelligent Machine Research, считается родоначальником создания коммерческих систем OCR.

В настоящее время наиболее распространены следующие методы сканирования:



Напечатанный документ помещается в освещенную область. Отраженный свет, собранный линзами, попадает на фотодиоды, расположенные по горизонтали. Блок видеоусиления увеличивает амплитуду сигналов, поступающих от фотодиодов, и преобразует их в сетку черных и белых точек.

Раздельно-щелевое сканирование последнего поколения использует технологию приборов с зарядовой связью (ПЗС матрицы).

Предобработка является важным этапом в процессе распознавания образов и позволяет производить сглаживание, нормализацию, сегментацию и аппроксимацию отрезков линий.

Сглаживание состоит из операций заполнения и утоньшения. Заполнение устраняет небольшие разрывы и пробелы.

Утоньшение представляет собой процесс уменьшения толщины линии, в которой сразу несколько пикселов ставятся в соответствие только одному пикселу. Известны последовательные, параллельные и гибридные алгоритмы утоньшения. Наиболее общие методы утоньшения основаны на итеративном размывании контуров, при котором окно (3х3) движется по изображению, и внутри окна выполняются соответствующие операции. После завершения каждого этапа все выделенные точки удаляются.

Нормализация состоит из алгоритмов, устраняющих перекосы отдельных символов и слов, а также включает в себя процедуры, осуществляющие нормализацию символов по высоте и ширине после соответствующей их обработки.

Сегментация осуществляет разбиение изображения на отдельные области. Как правило, прежде всего необходимо очистить текст от графики и рукописных пометок, поскольку перечисленные методы позволяют обрабатывать лишь незашумленный текст. Очищенный от различных пометок текст уже может быть сегментирован.

Большинство алгоритмов оптического распознавания разделяют текст на символы и распознают их по отдельности.

Это простое решение действительно эффективно, если только символы текста не перекрывают друг друга. Слияние символов может быть вызвано типом шрифта, которым был набран текст, плохим разрешением печатающего устройства или высоким уровнем яркости, выбранном для восстановления разорванных символов.

Разбиение текста на слова возможно в том случае, если слово является состоятельным признаком, в соответствии с которым выполняется сегментация. Подобный подход сложно реализовать из-за большого числа элементов, подлежащих распознаванию, но он может быть полезен, если набор слов в кодовом словаре ограничен по условию задачи.

Под аппроксимацией отрезков линий понимают составление графа описания символа в виде набора вершин и прямых ребер, которые непосредственно аппроксимируют цепочки пикселов исходного изображения. Данная аппроксимация осуществляется в целях уменьшения объема данных и может использоваться при распознавании, основанном на выделении признаков, описывающих геометрию и топологию изображения.

В высокоточных системах OCR, таких как, например, системы считывания и обработки машиночитаемых паспортно-визовых документов, качество распознавания, получаемое при распознавании отдельных символов, не считается достаточным. В таких системах необходимо использовать также контекстную информацию. Использование контекстной информации позволяет не только находить ошибки, но и исправлять их.



Обзор «интеллектуальной системы оптического распознавания»

Источник: http://www.ixbt.com/soft/finereader8.shtml.

FineReader компании ABBYY 2.0 появилась в 1995 году. Тогда компания ABBYY называлась более благозвучно «BIT Software».

Реальных конкурентов у FineReader тогда, впрочем, как и сейчас, не было. Да, был

Presto

!

OCR 3.0

, был

CuneiForm

2.95 с дистрибутивом всего в 4,3 МБ от российского разработчика Cognitive Technologies. Но всё это были разработки с менее удобным интерфейсом, с несколько меньшей точностью распознавания, а Presto!, как продукт западной разработки, либо вовсе не работал с русским языком, либо результаты распознавания приходилось долго и усиленно править. Правда, стоит отметить, что CuneiForm приемлемо работал на медленных компьютерах, тогда как у FineReader с этим были некоторые трудности.



Седьмая версия FineReader

, вышла в сентябре 2003 года совершенно тихо и не заметно. Как всегда было объявлено о совершенствовании алгоритмов и скорости распознавания, более качественной работе с PDF-файлами, увеличении числа языков распознавания, поддержке формата XML и тесной интеграции с Microsoft Office 2003. Заявлено о совершенствовании системы проверки орфографии, а также «очень актуальной» для многих пользователей поддержке распознавания штрих-кодов, в том числе двухмерных типа PDF-417.

В апреле 2000 года была выпущена обновлённая версия

CuneiForm 2000 R2

, на этом развитие проекта остановилось. С одной стороны - это понятно, поддерживать достойную конкуренцию FineReader очень нелегко

В отсутствие конкуренции, компания ABBYY два года работала над следующей версией своего пакета, уже восьмой в ряде продуктов FineReader.

Что нового в FineReader 8.0 Professional Edition? Вот что говорит разработчик:

«Новая версия ABBYY FineReader 8.0 Professional Edition сочетает в себе непревзойдённую точность распознавания, простоту использования и широкий диапазон настроек. Повышено качество распознавания факсов и документов, отсканированных с низким разрешением, на новый уровень выведено распознавание изображений, полученных с помощью цифровой камеры. Новый быстрый режим распознавания позволяет в несколько раз ускорить обработку качественно отпечатанных документов. Реализовано автоматизированное выполнение типовых задач распознавания, в том числе и по собственным сценариям. Быстрее и точнее стало преобразование PDF-файлов, добавлена функция защиты PDF-файлов паролем. Теперь в комплект поставки системы входит утилита для распознавания скриншотов».

Повышенная точность распознавания включает в себя, помимо традиционного улучшения самого алгоритма распознавания, повышение точности распознавания «специализированных» текстов, а также распознавания цифровых фотографий.

Повышение точности распознавания специализированных текстов обусловлено появившейся возможностью подключать при распознавании пользовательский словарь Microsoft Word, хотя, конечно, при его отсутствии преимущество этой функции будет неочевидно.

FineReader 8.0 научился отличать сфотографированные документы от отсканированных и применять при этом для обработки снимков новую адаптивную технологию распознавания. Учитывая куда большую распространённость цифровых фотоаппаратов, нежели сканеров, данная функция может быть весьма полезной для многих пользователей.

Дальнейшее развитие в FineReader 8 получила технология распознавания PDF-файлов. В новой версии усовершенствована технология обработки PDF-файлов. Как известно, некоторые PDF-файлы содержат так называемый текстовый слой, причём его содержимое может не полностью соответствовать видимому на экране документу.

FineReader 8.0 предварительно анализирует содержимое файла и для каждого текстового блока принимает решение: распознать его или извлечь соответствующий текст из текстового слоя.

Также появилась возможность защиты PDF–файлов паролем. Пароль может быть установлен как на открытие файла, так и на прочие действия с документом (печать, извлечение содержимого, возможность редактирования, внесение комментариев, добавление/удаление страниц и др.). Предусмотрена возможность выбрать один из трёх уровней шифрования: 40-битный, 128-битный на основе стандарта RC4, 128-битный уровень, основанный на стандарте AES (Advanced Encryption Standard).

Добавлена возможность работы с дополнительной информацией PDF-файлов (заголовок, предмет, автор, ключевые слова). Эту информацию можно извлекать, редактировать или задавать заново по своему усмотрению

При преобразовании PDF-файла и сохранении результатов распознавания в форматы Microsoft Word, PDF и HTML FineReader 8.0 по умолчанию восстанавливает все гиперссылки, найденные в исходном документе. К таковым относятся как ссылки на внешние источники (интернет-сайты, другие файлы, и т.п.), так и внутренние ссылки, ведущие на другие страницы того же документа.

ABBYY FineReader 8.0 способен открывать графические файлы формата TIFF, сжатые по алгоритму LZW. Появилась возможность сохранять результаты распознавания в формат Microsoft Reader eBook (LIT), один из самых популярных форматов для создания электронных книг. При сохранении результатов распознавания в любом из форматов PDF, HTML, PPT, DOC, RTF, можно задавать цветность картинок – цветная, серая или чёрно-белая. Например, если в документе много цветных иллюстраций, может быть полезно сохранить некоторые из них как серые или чёрно-белые. Это существенно уменьшит размер получившегося файла.



Автоматическая обработка документов

Процесс распознавания документов очень часто состоит из одного и того же набора операций. Например, сканирование, распознавание, сохранение распознанного текста в определённом формате.

Для экономии времени пользователя в FineReader 8.0 предусмотрена возможность автоматизации однотипных действий. Для этого описано несколько наиболее распространённых сценариев обработки документов. Для запуска сценария достаточно просто нажать одну кнопку — вся остальная работа будет выполнена системой автоматически, в соответствии с настройками сценария.

При предварительной обработке изображений появилась специальная опция

исправления разрешения

. Эта настройка увеличивает точность распознавания в тех случаях, когда изображение отсканировано с низким разрешением, получено с помощью цифровой камеры или представляет собой скриншот экрана. Если обрабатывать такие изображения без предварительной коррекции, качество окажется невысоким. Поэтому FineReader 8.0 при добавлении изображений в пакет проверяет каждое из них. В случаях, когда разрешение изображений оказывается неподходящим для системы оптического распознавания, автоматически производится его коррекция. При желании пользователь может устанавливать разрешение изображений вручную.

Одной из самых интересных новых функций, как мне кажется, стало «выпрямление» строк. Зачастую при сканировании толстых книг и журналов строки текста вблизи сгиба оказываются искривлены. Схожая проблема встречается при фотографировании: строки искривляются вблизи краёв документа. В восьмой версии FineReader появилась функция, позволяющая устранить подобные искажения и увеличить, таким образом, качество распознавания.

И, наверное, одно из наиболее весомых нововведений - поддержка технологий Intel Dual Core и Hyper-Threading, позволяющая повысить скорость распознавания в фоновом режиме при работе на современных процессорах Intel.

Основными параметрами сканирования являются:


При обработке изображений выделяют блоки следующих типов:

Программное обеспечение для работы с графикой


Среди программ, предназначенных для создания компьютерной двумерной живописи, самыми популярными считаются

Painter

компании Fractal Design,

FreeHand

компании Macromedia, и

Fauve Matisse

.

Пакет Painter обладает достаточно широким спектром средств рисования и работы с цветом. В частности, он моделирует различные инструменты (кисти, карандаш, перо, уголь, аэрограф и др.), позволяет имитировать материалы (акварель, масло, тушь), а также добиться эффекта натуральной среды.

В свою» очередь, последние версии программы FreeHand обладают богатыми средствами редактирования изображений и текста, содержат библиотеку спецэффектов и набор инструментов для работы с цветом, в том числе средства многоцветной градиентной заливки.

Adobe Photoshop


Сегодня он является стандартом в компьютерной графике, и все другие программы неизменно сравнивают именно с ним.

Главные элементы управления программы Adobe Photoshop сосредоточены в строке меню и панели инструментов. Особую группу составляют диалоговые окна – инструментальные палитры:



Особую группу программных средств обработки изображений представляют

Фильтры

. Это подключаемые к программе модули, часто третьих фирм, позволяющие обрабатывать изображение по заданному алгоритму. Иногда такие алгоритмы бывают очень сложными, а окно фильтра может иметь множество настраиваемых параметров. Из групп фильтров популярны продукты серий Kai's Power Tools, Alien Skin, Andromeda и другие.

В настоящее время создано множество пакетов иллюстративной графики, которые содержат простые в применении, развитые и мощные инструментальные средства векторной графики, предназначенной как для подготовки материалов к печати, так и для создания страниц в интернете.


Corel Draw


Пакет CorelDraw всегда производит сильное впечатлени. В комплект фирма Corel включила множество программ, в том числе Corel Photo-Paint. Новый пакет располагает бесспорно самым мощным инструментарием среди всех программ.

Однако что касается подготовки публикаций для Web, то здесь CorelDraw уступает CorelXara. Работа CorelDraw с цветами CMYK оставляет желать лучшего. Цвета файлов GIF и JPEG заметно отличались от цветов, выводимых для пробного отпечатка Matchprint, в то время как пакет FreeHand воспроизводил одинаковые цвета на экране, в файлах Web и на принтерах.

Художественные возможности оформления текста в CorelDraw безупречны, а принимаемые по умолчанию параметры для межбуквенных интервалов при размещении текста вдоль кривой не требуют настройки, исключающей наложение букв, - в отличие от Canvas и FreeHand. Инструмент "лупа" не имеет себе равных - он позволяет получить множество специальных эффектов, в том числе возможность увеличения только фрагмента изображения и автоматической настройки цветов текста в зависимости от цвета фона.

Можно вырезать изображения, накладывать цветные фильтры и придавали растровым изображениям вид изогнутой страницы, используя двух- и трехмерные эффекты и внешние модули PhotoShop. Когда нужно редактировать пикселы, CorelDraw автоматически переключает на Corel Photo-Paint, где можно редактировать файл и сохранять его непосредственно в CorelDraw. Однако, помимо базовых возможностей масштабирования и средств динамического назначения размеров, CorelDraw не содержит специальных средств подготовки технических иллюстраций, подобных Smart Mouse в Canvas или копирования массивов в Designer.

Несмотря на мощный инструментарий, CorelDraw грешит отдельными недостатками. Широкий набор инструментальных средств делает CorelDraw исключительно удобным для рисования, но неестественный вид печатных страниц и страниц Web ограничивает возможности применения этого пакета.

Micrografx Designer 7


Micrografx Designer 7 - наряду с FlowCharter 7 и Picture Publisher 7 образует ядро комплекта Micrografx Graphics Suite, представляет собой одну из наименее дорогих среди программ данного обзора. Инструментальные средства рисования пакета Designer - одни из самых простых для освоения и применения. Подобно CorelXara, в Designer не предусмотрено окно редактирования текста, что заставляет вас редактировать его постоянно в режиме полного соответствия WYSIWYG. Перемещения между слоями очень неудобны и хотя можно пользоваться несколькими страницами различного формата, для перемещения объектов между страницами требуется монтажный буфер.

Designer формировал хорошие файлы GIF со смешением цветов, файлы GIF без смешении цветов с изображениями, напоминающими плетеные корзины, и аномальные файлы JPEG с изображениями, имеющими вид пузырьков. Designer позволяет также присоединять URL к объектам, чтобы использовать их вместе с внешним модулем браузера Micrografx QuickSilver 3.

Designer 7 с помощью простого интерфейса позволяет легко справиться со многими типичными для офиса графическими работами, но принципиальные ограничении инструментальных средств и весьма скудные возможности для четырехцветной печати CMYK могут заставить профессиональных художников-графиков воздержаться от его приобретения. Но если необходимо мощное средство для технического черчения или нужно, работая в интерактивном режиме, размещать материалы на страницах Web, обходясь при этом без программирования, то возможно следует остановить свой выбор именно на этом пакете.

Adobe Illustrator 7


По функциональным возможностям Illustrator сегодня настолько уступает пакету CorelDraw, не говоря уже о Macromedia FreeHand 7, что мы не стали бы рекомендовать этот пакет для профессиональных художников-графиков.

Подсчитано к примеру, что для градиентная закраска изображения радуги, требующая 5 щелчков мышью в CorelDraw, в случае пакета Illustrator потребует 67 щелчков, поскольку вам придется создавать переходы для каждой пары основных цветов.

Illustrator не позволяет экспортировать файлы .GIF и JPEG для использования в Web. И хотя качество цветной печати остается самой сильной стороной пакета Illustrator, возможности обработки цветов CMYK в FreeHand понравится вам ничуть не меньше (кроме того, одна и та же версия FreeHand может работать в среде как для Windows, так и Mac). Нужно помнить также о проблемах, возникающих при применении Illustrator с графическими платами на основе S3.

Macromedia FreeHand 7


Пакет Macromedia FreeHand 7 поражает безупречным качеством вывода на экран и четырехцветной печати CMYK и наличием нескольких форматов для Web. Поскольку FreeHand всегда отображает цвета так же, как они будут выглядеть при печати, эта программа была единственной в нашем обзоре, не допускавшей создание или назначение цветов, которые при печати сильно отличались бы от соответствующих цветов на экране. В списке цветов FreeHand указываются только те цвета, которые были использованы или созданы вами. Программа позволяет отбирать цвета из нескольких библиотек, в том числе Pantone и Hexachrome для печати, и из палитры Web, оптимизированной как для Mac, так и PC.

Инструментарий FreeHand для рисования и работы с текстом отвечает необходимым требованиям, но несколько ограничен. В интерфейсе FreeHand отдано предпочтение редактированию узлов, а не редактированию объекта в целом. Каждая из операций масштабирования, поворота, зеркального отображения и деформации - выполняемые в CorelDraw манипуляциями в рабочем окне объекта - требует отдельного инструмента из набора инструментари FreeHand. При выборе объекта его точки (узлы) всегда доступны для непосредственного редактирования, но это означает, что вы видите узлы и траектории объекта, а не его "законченный" вид.


Corel Xara 1.5


Работать с CorelXara - все равно что сидеть за рулем элегантного красного "Феррари" с откидным верхом в красивом весеннем парке. Простой и ясный интерфейс CorelXara прежде всего вызовет у вас вопрос: почему считается, что пользоваться пакетами иллюстративной графики очень сложно?

CorelXara 1.5 - служит в первую очередь для создания графического изображения на странице за один раз и формирования блока текста за один раз. Программа позволяет выполнять с рисунками, градиентным заполнением, изображениями и диапозитивами такие действия, о которых вы могли только мечтать.

Хотя Corel рекламирует CorelXara 1.5 как дополнение к CorelDraw 7 для создания графики Web, по существу благодаря высокой производительности, средствам для работы с Web и специализированному инструментарию CorelXara превосходит CorelDraw во многих отношениях.

Благодаря возможностям масштабирования векторной графики и текстурам растровых изображений двумерные объекты начинают все более напоминать трехмерные. Нарисуйте объект. Наложите текстуру (растровое изображение) или закрасьте его (материал). Определите уровень прозрачности. Затем переместите изображение и отредактируйте по своему вкусу.

Интерфейс CorelXara элегантен и прост. Пиктограммы в верхнем ряду обеспечивают доступ к полноцветным визуальным наборам цветов, заполнений, штриховок, растровых изображений, шрифтов и графических вставок (клипартов).

CorelXara облегчает управление цветом путем создании семейств связанных оттенков. Измените основной цвет с синего на зеленый, и ваш объект изменит всю гамму оттенков. Заметьте, что CorelXara не содержит специальных инструментальных средств для технических иллюстраций и, кроме того, вы должны самостоятельно вводить текст, поскольку в CorelXara не предусмотрены фильтры импорта для программ обработки текста. Тем не менее эта программа была единственной из рассмотренных в обзоре, которая позволяла размещать несколько строк текста вдоль одной криволинейной направляющей, а ее коллекция шрифтов не только содержит их названия, но и показывает гарнитуры.



Гипертекст

(Hypertext) - это документ (в первую очередь текстовый), содержащий гиперссылки.

Гиперссылка - это связь слова или содержащегося в документе изображения с другим ресурсом, которым может быть как еще один документ, так и раздел текущего документа. Подобные "связанные" слова или картинки документа, как правило, выделяются по оформлению из общего текста. Общепринятой является практика подчеркивания слова или предложения, связанного гиперссылкой.

Практическое применение идеи и сам термин "гипертекст" появился с возникновением электронных документов, задолго до появления службы WWW. Поскольку современные электронные документы содержат не только текст, но и мультимедиа-информацию, понятие гипертекста было расширено до понятия гипермедиа.



Гипермедиа

- это метод организации мультимедиа-информации на основе ссылок на разные типы данных. Гипермедиа-документы могут использоваться не только в WWW, но и, например, в электронной энциклопедии на CD-ROM, где ссылка в тексте часто ведет на аудио- или видеоролик.

Особенно продуктивной идея гипертекста оказалась применительно к объединению цифровой информации, распределенной на серверах во всем мире.

Документ, доступный через Web, называют Web-страницей, а группы страниц, связанных общим именем, темой и объединенных навигационно, - Web-сайтами. Первую страницу, которую видит пользователь при обращении на тот или иной ресурс, называют стартовой, домашней или индексной страницей (home page). Система гиперссылок определяет структуру Web-сайта.

Страницы на сайте могут иметь линейную древовидную структуру, но чаще на каждой странице имеется несколько ссылок, что и позволяет говорить о структуре "паутина" (рис.).



Рис.

Различные варианты структуры сайта

Понятие "

мультимедиа

" настолько широко и расплывчато, что в него можно включить огромный спектр программного и аппаратного обеспечения, от 8-битной звуковой платы и накопителя для компакт-дисков с одинарной скоростью до профессиональных программ и компьютеров, используемых при создании специальных киноэффектов и даже целых компьютерных фильмов.



Мультимедиа

- это взаимодействие визуальных и аудиоэффектов под управлением интерактивного программного обеспечения.

Мультимедиа

- это:

Таким образом, в широком смысле термин "мультимедиа" означает спектр информационных технологий, использующих различные программные и технические средства с целью наиболее эффективного воздействия на пользователя (ставшего одновременно и читателем, и слушателем, и зрителем).

Благодаря применению мультимедиа в средствах информатизации за счет одновременного воздействия графической, звуковой, фото и видео информации такие средства обладают большим эмоциональным зарядом и активно включаются в индустрию развлечений, практику работы различных учреждений, домашний досуг, образование.

Технологии мультимедиа позволяют осмысленно и гармонично интегрировать многие виды информации. Это позволяет с помощью компьютера представлять информацию в различных формах, часто используемых в школьном обучении, таких как:


Мультимедиа - продукты можно разделить на несколько категорий в зависимости от того, на какие группы потребителей они ориентированны:

Инструментальные средства и языки для создания мультимедиа и гипермедиа


Для создания многих простейших мультимедиа-ресурсов широко используются различные HTML-редакторы. При этом следует учитывать, что язык HTML достаточно динамично развивается, так что ресурсы, удовлетворяющие новому стандарту языка, могут некорректно воспроизводиться старыми версиями браузеров - программами просмотра гипермедиа-ресурсов.

Говоря более точно, следует отметить, что при создании гипермедиа-средств обучения чаще всего используются следующие языки и инструменты:



Чтобы можно было реализовать приложения мультимедиа в среде Windows, фирмой Microsoft был выпущен

специальный пакет программ для создания мультимедиа

под названием Multimedia Viewer Publishing Toolkit. Этот пакет состоит из следующих четырех частей:

Тесная связь мультимедиа-технологий и средств разработки и использования гипертекста делает целесообразным изучение

инструментария

, с помощью которого создаются гипермедиа средства обучения.

HyperWave.

Этот проект появился в 1990 году и первоначально имел название Hyper-G. Сейчас это сложная система управления документами Web в больших информационных пространствах. Она позволяет проводить иерархическое структурирование, управление связями, полнотекстовый поиск и поиск по атрибутам, интерактивное редактирование связей и документов и многое другое.

Microcosm.

Открытая гипермедиа система для разработки онлайновых мультимедиа-учебников, справочников и документации. В ней интегрированы результаты десятилетних исследований в области гипертекста, лингвистики и статистического анализа, которые проводились в в Англии. Реализовано автоматическое, динамическое связывание мультимедиа-информации, обеспечивается тематический поиск и навигация.

Storyspace.

Система, поддерживающая процесс написания гипермедиа-произведений. Разрабатывалась специально для писателей, лучше всего подходит для работы с большими и сложными гипертекстами. Она аккумулировала многие черты системы Intermedia, фактически является ее наследницей. Разрабатывается в Eastgate Systems, в ее среде написаны многие художественные произведения.

WebThing.

Объектно-ориентированная гипермедиа-система, спроектированная для совместной авторской работы. Предназначена для телекоммуникационных сетей. Документы в WebThing генерируют HTML связи из других документов, избавляя авторов от необходимости их создания и устраняя проблему устаревших и оборванных ссылок.

World Wide Web.

Самая популярная гипермедиа-система, основанная на клиент-серверной архитектуре и работающая в сети Интернет.

     Педагогам, связанным с разработкой электронных средств обучения для системы общего среднего образования, важно иметь представление об основных стандартах, используемых в гипермедиа-средствах.



SGML

- сокращенное название международного стандарта ISO/IEC 8879:1986. Полное название: Information Processing - Text and Office Systems - Standard Generalized Markup Language (SGML). SGML образует основу целого ряда стандартов. Это метод (правила) создания и разметки структурированных документов. Документами, разрабатываемыми в соответствие с этим стандартом, могут обмениваться самые разные несходные мультимедиа-системы. (Ссылка на сайт с информацией о SGML: http://www.oasis-open.org/cover/general.html).

HTML

- HyperText Markup Language - правила (метод) создания гипермедиа-ресурсов для публикации в сети Интернет. Является приложением языка SGML. Большинство HTML-браузеров не поддерживает некоторые конструкции SGML, однако программы для разработки SGML-документов могут производить хорошие HTML-документы. (Спецификацию HTML 4 можно найти по адресу http://www.w3.org/TR/REC-html40/, дополнительные данные - по адресу http://www.oasis-open.org/cover/).

HyTime

- сокращенное название международного стандарта ISO/IEC 10744:1992. Полное название: Hypermedia/Time-based Structuring Language. Он обеспечивает стандартную техническую основу для интегрированной открытой гипермедиа-технологии, включая SDML, Standard Music Description Language (ISO/IEC Committee Draft 10743). HyTime является расширением SGML, он добавляет набор форматов ("SGML architectural forms"), чьи синтаксис и семантика как раз и являются содержанием стандарта HyTime. Они обеспечивают системно-независимое представление ссылок, информационных адресов, размещение информационных мультимедиа-объектов во времени и пространстве. (Информация - по адресам: http://www.oasis-open.org/cover/hytime.html и http://www.hytime.org).

XML

- формирующийся новый стандарт под названием Extensible Markup Language. В отличие от HTML, XML не является приложением SGML. Это набор простых условий для применения SGML. (Информация о XML: http://www.oasis-open.org/cover/xml.html и http://www.xml.com).

Верстка гипертекстовых HTML-страниц является первым и наиболее трудоемким этапом в процессе компьютерной реализации текста. Сначала верстаются текстовые материалы по тематическим разделам курса, затем дополнительные и хрестоматийные материалы. Текстовый материал по тематическим разделам курса является своеобразной "нитью", на которую нанизывают множество "бусинок" дополнительного материала (список терминов, список литературы, хрестоматия, персоналии и т.д.) и иллюстративного материала (схемы, графики, фотографии, анимированные и озвученные схемы (Flash-анимация)).

Компьютерную верстку текстовых материалов можно осуществить с использованием каскадных таблиц стилей (CSS - Cascading Style Sheets) и языка программирования JavaScript (универсальный язык создания сценариев, обычно включается в HTML-файл и интерпретируется браузером).

Для создания гипертекстовых ЭСО можно использовать HTML-редактор HomeSite. Он обладает продуманным и удобным интерфейсом и интегрируется со многими популярными пакетами, такими как Microsoft Office, Macromedia Dreamweaver, Watchfire Linkbot, Allaire ColdFusion и др.






Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат