Уникальные учебные работы для студентов


Информационная технология обработки текстовой информации реферат по

История возникновения программных средств обработки текста. Различные форматы текстовых файлов……………………………10 4. Технологии анализа и поиска текстовой информации………. Публикация электронных документов с информационная технология обработки текстовой информации реферат по сети. Программы оптического распознавания символов……………. Информация, выраженная с помощью естественных и формальных языков в письменной форме, называется текстовой.

В общем случае электронная система обработки текстовой информа-ции состоит из видеотерминала, возможно, специально сконструирован-ного или модифицированного для этих целей, некоторой внешней памяти для хранения специального программного обеспечения и файлов с тексто-вой информацией, а также печатающего устройства, позволяющего по-лучать качественные копии созданных документов.

Средства обработки текстовой информации, несмотря на их весьма широкий спектр, обеспечи-вают следующие основные функции: Актуальность написания данной курсовой работы вызвана той важ-ной ролью, которая принадлежит программным средствам и технологиям обработки текстовой информации, так как ввод информации с бумаги информационная технология обработки текстовой информации реферат по ком-пьютер является в настоящее время часто выполняемой задачей. Целью написания данной курсовой работы является изучение теоре-тических основ средств и технологий обработки текстовой информации.

Для достижения поставленной цели были сформулированы следующие задачи: Он собрал машину и вскоре начал создавать и продавать неболь-шие программы, которые со временем получались всё более и более слож-ными, а потому и руководства к ним усложнялись. Шрейер пришёл к выво-ду, что целесообразно готовить эти руководства с помощью компьютера, а не печатать их на машинке.

Распространялась данная программа при помощи почты, потому что магазинов, занимающихся продажей программного обес-печения, практически не.

Скачать файл с работой

Однако по мере расширения рынка персональных компьютеров другие предприниматели информационная технология обработки текстовой информации реферат по стали делать шаги в данном на-правлении.

Одним из них был житель Нью-Йорка Сеймур Рубинштейн, в планы которого входило создание текстового процессора. Совместно с программи-стом Джоном Барнэби при помощи многочисленных опросов было выясне-но, какими возможностями должен обладать текстовый процессор, чтобы привлечь внимание потенциальных покупателей.

Так, в информационная технология обработки текстовой информации реферат по году появилась довольно удачная система, которая получи-ла название WordStar, которая практически сразу же стала стандартом тек-стовых процессоров для микрокомпьютеров.

Классификация программного обеспечения Инструментальные программы для подготовки текстов программ, документов, описаний называются текстовыми редакторами text-editorмощные текстовые редакторы с расширенным спектром функций называют также текстовыми процессорами word-processor. Некоторые текстовые процессоры могут работать не только с текстами, но и с изо-бражениями, например, редактировать иллюстрированные документы. Основные функции текстовых редакторов и процессоров: Текст на экране можно пере-двигать вверх-вниз, влево - вправо с помощью клавиш, поме-ченных стрелками, а также быстро заменять фрагмент текста на другой фрагмент по номеру строки.

При этом текст сжимается.

  • Текстовый документ можно создать следующими способами;
  • К текстовым редакторам и процессорам можно отнести;
  • Основные возможности Russian Context Optimizer:

Простейшие редакторы не используют перенос слов информационная технология обработки текстовой информации реферат по слово не помещается в строке, то оно целиком пе-реносится на следующую строку. Это удобно при подготовке текста к типо-графской печати. Текстовые редакторы разделяются на три группы: По сравнению с редакторами общего назначения специализирован-ные редакторы позволяют легче готовить и редактировать соответст-вующие тексты: Текстовый редактор MS DOS Editor может применяться только для редактирования текстов файлов канонического формата, состоящих лишь из букв и цифр и не имеющих изображений.

Имеет ограниченные возможности, но очень простой для изучения использования. Среди других средств редактирования, используемых в ОС Windows, можно отметить тексто-вые процессоры Word Pad, Word 6.

Технология обработки текстовой информации — реферат

Много-оконные процессоры, предназначенные для ввода, редактирования и форматирования текстов, могут работать одновременно с несколькими документами, каждый информационная технология обработки текстовой информации реферат по которых отображается в своем окне. Можно менять размеры окон, а также вид и начертание шрифтов, оформлять текст в несколько столбцов, выполнять многие другие операции. Многооконный текстовый процессор MS Word 2003 - один из са-мых совершенных, входит в пакет MS Office 2003 имеет сотни опера-ций над текстовой и графической информацией.

Как и ОС Windows, информационная технология обработки текстовой информации реферат по по оконной технологии с использованием ниспадающих меню и пиктограмм. Обладает универсальностью, позволяет достаточно быстро и с высоким качеством готовить практически любые документы: Имеет множество техноло-гических приемов редактирования текстово-графической информации, широкий набор шрифтов разной формы и размера, проверку орфографии и грамматики, автоматический перенос слов.

Позволяет вставлять в текст таблицы различ-ного размера и сложности, поворачивать текст на странице, вставлять номера страниц и многое другое.

Информация о работе

Благодаря этим возможностям с помо-щью редактора Word может выполняться верстка документов, как это делается в типографиях. Имеются средства, облегчающие подготовку документов для сети Internet. Усовершенствованием рассмотренных выше редакторов Word явля-ется более удобный в работе текстовый процессор WordPerfect, имею-щий ряд версий.

Редактор контролирует правописание, вычерчивает от-резки линий, оформляет рамки, формирует ссылки, оглавления, указате-ли, имеет много других возможностей.

Универсальность процессоров Word сопряжена, однако, и с некото-рыми недостатками, к которым относятся трудности освоения и относи-тельно низкая производительность при редактировании простых тек-стов. Информационная технология обработки текстовой информации реферат по наличии в тексте большого количества сложных мате-матических или химических формул более производительным может быть, например, редактор ChiWriter. Различные форматы текстовых файлов документов Формат файла определяет способ хранения текста в файле.

Про-стейший формат текстового файла содержит только символы числовые коды символовдругие же форматы содержат дополнительные управ-ляющие числовые коды, которые обеспечивают форматирование текста. Существуют универсальные форматы текстовых файлов, которые могут быть прочитаны большинством текстовых редакторов, и ориги-нальные форматы, которые используются отдельными текстовыми ре-дакторами. Для преобразования текстового файла из одного формата в другой используются специальные программы - программы-конверторы.

В хороших текстовых редакторах конверторы входят в состав системы. Информационная технология обработки текстовой информации реферат по некоторые наиболее распространенные форматы тек-стовых файлов: Сохраняет текст без форматирования, в текст вставляются только управляющие символы конца абзаца.

Применяют этот формат для хранения документов, которые должны быть прочитаны в прило-жениях, работающих в различных операционных системах. Универсальный формат, который сохраняет все форматирование. Преобразует управляющие коды в команды, которые могут быть прочитаны интерпретированы многими приложениями, в результате инфор-мационный объем файла существенно возрастает.

Использует 16-битную кодировку символов, что требует использования шрифтов Unicode. Оригинальный формат версии Word 2007. Не поддерживается более ранними версиями Word; имеется возможность сохранить документ в фор-мате Word 2003, но часть форматирования касающаяся новых возможностей версии 2007 может быть утеряна.

Оригинальный формат интегриро-ванной системы Works 4. При преобразовании из формата Word форматирование сохраняется не полностью. Содержит управляющие коды тэги языка разметки гипертекста. Оригинальный формат отечественного текстового редактора Лексикон. Для просмотра та-ких файлов подходит программа Adobe Reader и др. Выбор требуемого формата текстового документа или его преобра-зование производится в процессе сохранения файла. Технологии анализа и поиска текстовой информации Доступные сегодня вычислительные мощности позволяют приме-нить широкий класс методов для обработки больших массивов докумен-тов, эффективно решая задачи поиска, классификации, кластерного ана-лиза, выявления скрытых закономерностей и.

  • Про-стейший формат текстового файла содержит только символы числовые коды символов , другие же форматы содержат дополнительные управ-ляющие числовые коды, которые обеспечивают форматирование текста;
  • Например, группа новостей, описывающих информационные технологии Internet, назы-вается comp.

Тематический анализ текста формирует список ключевых понятий - тем документа, ранжированных по значимости. Позволяет производить поиск документов по интересующей теме, сравнивать документы по со-держанию, исследовать тематический состав и временную динамику информационных потоков.

Анализ смысловых связей выявляет отношения между понятиями текста и формирует семантическую сеть на множестве документов. По-зволяет исследовать семантическое окружение целевых объектов пер-сон, организаций, событий в документах; выявлять подкрепления из-вестных и неизвестных связей, расширять и уточнять поисковые запро-сы.

Автоматическое реферирование формирует общие и тематические рефераты документов в форме ключевых фраз, раскрывающих содержа-ние текста. Автоматическая рубрикация позволяет создавать иерархические рубрикаторы на основании анализа коллекций документов и классифи-цировать документы по рубрикам.

Обработка текстовой информации програмными средствами

Нечеткий поиск позволяет расширять запрос близкими по написа-нию словами из коллекции документов, по которым ведется поиск. Спо-собен быстро найти все лексикографически близкие слова, отличающие-ся заменами, пропусками и вставками нескольких символов. Лингвистическое обеспечение включает в себя средства морфоло-гического и синтаксического анализа, а также тезаурус общей лексики русского языка. Технологии реализованы в пакете программных модулей, готовых для встраивания в информационно-поисковые системы.

В течение последних лет продукт непрерывно совершенствовался, расширялись функциональные возможности, повы-шались надежность и производительность программного обеспечения. Основные возможности Russian Context Optimizer: Поиск документов с учетом информационная технология обработки текстовой информации реферат по грамматических форм слов запроса, поиск слов, близких по написанию - нечеткий поиск; поиск документов по ключевым темам, которые автоматиче-ски выделяются при индексировании; 2.

Расширение запроса синонимами, более общими и более ча-стными понятиями на основе тезауруса русского языка; 3. Выявление смысловых связей между темами документов, что позволяет расширять или уточнять запрос близкими темами; 4. Составление общих и тематических рефератов документов; 5. Автоматическое построение иерархических рубрикаторов и классификация документов по рубрикам; 6. Обеспечение полноценной работы с БД, содержащими тексты на нескольких языках; 7. Поддержка всех кодовых страниц русского языка.

Публикация электронных документов с использованием сети Гипертекст - это способ управления данными, при котором послед-ние организованы в виде сети узлов, объединенных между собой связя-ми. Узлы могут быть текстовыми документами, графическими картин-ками, видеофильмами, аудиозаписями и т. В то время он руководил разработкой исследовательской гипертекстовой системы Intermedia в университете Брауна США. Система типа гипермедиа обеспечивает возможность работы с гра-фическими картинками, фотографиями, фильмами, музыкой и речью.

Реализация новых информационных технологий, связанных с опуб-ликованием в сети электронных документов, в настоящее время выпол-нена в виде: Каждая группа новостей имеет свое название. Система информационная технология обработки текстовой информации реферат по име-ет иерархическую структуру. Например, группа новостей, описывающих информационные технологии Internet, назы-вается comp.

В свою очередь, ка-ждая подгруппа может быть разбита на новые подгруппы. Электронная почта является другим важным средством обмена ин-формацией информационная технология обработки текстовой информации реферат по Internet. Она появилась приблизительно в то же время, что и Usenet. Долгое время Usenet даже использовала для передачи новостей каналы электронной почты. Главной задачей электронной почты являет-ся обеспечение надежной и быстрой доставки корреспонденции.

Преимущества электронной почты перед обычной очевидны: Если абонент включен в глобальную сеть Internet непосредственно через IP-соединение, то он получит послание через несколько секунд. Если абонент имеет комму-тируемое соединение с Internet, то скорость доставки ограни-чивается периодичностью его подключения, которую он оп-ределяет. В любом случае, пользователь точно получит послание в течение дня.

VK
OK
MR
GP