Системы технического зрения


ГЛАВА 6. СИСТЕМЫ ТЕХНИЧЕСКОГО ЗРЕНИЯ

Человек по визуальному каналу получает более 60% всей информации, регулирующей его взаимодействие с внешней средой. (От глаз к мозгу передаются сигналы по двум из трех миллионов нервных волокон, связанных с мозгом). Это же справедливо и для искусственных сенсорных систем: те из них, которые используют визуальную информацию, обладают наибольшей информативностью. В классе ОЛС особое место занимают системы технического зрения (СТЗ), относящиеся к группе бесконтактных пассивных информационных средств. Для большей части СТЗ характерно отсутствие излучателя; система содержит только приемник собственного излучения объекта. Однако в некоторых случаях излучатель используется, это относится, в частности, к рентгеновским телевизионным системам. СТЗ функционируют в широком диапазоне электромагнитного излучения - от 10-1 м (для телевидения ОВЧ) до 10-9 м. Существенной особенностью систем этого типа является необходимость формирования изображения объекта, представляющего собой рас­преде­ление интенсивности его двумерной функ­ции яркости L(x, y). Заметим, что для большинства систем локации фун­кция распределения интенсивности одномерная - L(z). СТЗ нашли применение в задачах визуального контроля, наблюдения, управления и многих других.

Наибольшее распространение получили системы, работающие в видимом диапазоне волн - 380 … 780 нм. Поскольку, все окружающие предметы поглощают и отражают разное количество света в зависимости от его длины волны, то и спектральная отражательная способность объекта распределяется в видимом диапазоне волн неравномерно. Эта особенность приводит к тому, что поверхность объекта воспринимается разноцветной. Кроме того, и амплитуда отраженного от объекта сигнала, т.е. его яркость неодинакова. Разница в средней яркости соседних структур воспринимается как их контраст. Средняя яркость окружающей среды варьируется в широких пределах: от 10-6 кд/м2 пасмурной ночью, 10-1 кд/м2 в полнолуние, до 107 кд/м2 в солнечный день на снежном поле. Человек способен достаточно уверенно ориентироваться в этом диапазоне яркостей, поскольку его зрение способно воспринимать энергии, крайние значения которых соотносятся как 1: 1011. Однако этот диапазон не является динамическим, т.к. для зрения свойственна адаптация к освещению и при постоянном освещении диапазон воспринимаемых яркостей не превышает 100.

6.1. Основные понятия

Системы зрения предназначены для восприятия визуальной информации об окружающей среде, обработки и анализа изображений рабочих сцен с целью решения задачи распознавания образов. Обработка визуальной информации, как в живых, так и технических системах заключается в получении некоторого представления сцены - ее изображения и формирование последующего описания. Описание должно, с одной стороны, содержать всю существенную информацию о сцене, а с другой - обеспечивать обработку изображений за необходимое время. В этом смысле, при описании происходит частичное выделение искомой информации, при некоторой потере общей. Баланс этих двух процедур является важнейшей задачей СТЗ. Под распознаванием образов будем понимать процесс, при котором на основании многочисленных характеристик (признаков) некоторого объ­екта определяется одна или несколько наи­более существенных, но недоступных для непосредственного определения его характеристик, в частности его принадлежность к определенному классу объектов. Данное определение является «киберне­тическим» и используется в задачах искусственного интеллекта при анализе любых слож­ных изображений, когда отсутствует ограничение по времени обработки данных. Функционирование робототехнических систем обычно осуществляется в «реальном масштабе времени» и требует разрешения классического про­тиворечия между быстродействием системы и ее объемом памяти. В этом смысле, далеко не все задачи распознавания являются доступными. Так, например, рас­познавание сло­жных трехмерных образов требуют очень высоких ресурсов производительности 1 .. 100 109 MIPS (миллионов операций в секунду). Поэтому, такие задачи «напрямую» в робототехнике не решаются. Здесь традиционным путем является конкретизация начальных условий - позволяющая упростить алгоритмы распознавания. В частности, в большинстве случаев ограничиваются плоскими изображениями объектов. Если требуется восстановить форму объекта, используется несколько изображений, причем таких, на которых видны все точки поверхности и их взаимное положение. Однако и в этом случае, форма объекта может оказаться недоступной для непосредственного рассмотрения. В зависимости от формы различают два класса объектов:

  • объекты, все точки которых можно увидеть под определенными углами зрения;

  • объекты, некоторые точки невидимы независимо от угла зрения.

Так, полное описание выпуклого объекта можно получить на основании двух его изображений (напри­мер, при использовании двух видеодатчиков с правильно выбранным направлением съем­ки рис. 6.1). Под выпуклым понимается объект, для которого касательная плоскость в любой точке поверхности не разрезает эту поверхность.

Способ расположения видеодатчиков зависит от того, необходима ли информация о рельефе объектов. Двумерные неподвижные датчики такую информацию дать не могут, и поэтому в состав СТЗ входят либо несколько двухмерных датчиков, либо сканер - подвиж­ный двумерный дат­чик. (Анало­гично полу­чают двумерную информацию от одномерного датчика, сканируя им рабочую сцену).

Вообще говоря, поверхность реального объекта является сложной и содержит как выпуклые участки, так и вогнутые. При анализе подобных объектов необходимо выбирать бесконечное множество направлений съемки, покрывающих телесный угол 4. Однако и в этом случае возможны области недоступные для наблюдения. Таким образом, даже максимально полное трехмерное описание объ­екта, может оказаться недостаточным для его адекватного распознавания. Поэтому, распознавание образов в СТЗ (как, впрочем, и у человека) основывается на признаках, полученных при анализе частичных изображений.

По назначению СТЗ ус­ловно можно разделить на два класса:

  1. прикладные (пре­дназначенные для обработки ограниченного количества изображений с заданным бы­стро­действием);

  2. универсальные (позволяющие анализировать сложные сцены на основе принципов искусственного интеллекта).

Первые исследовательские СТЗ появились в конце 60-х годов ХХ века. В Стенфордском проекте «глаз - рука» СТЗ со­держала телекамеру на основе видикона, устройство полукадрового ввода изображения 606500 элементов с 16 градациями яркости и ЭВМ типа PDP-6. В 1972 году в Массачусетском Технологическом Институте была разработана опытная система для обработки трех­мерных сцен. Родоначальником промышленных СТЗ явилась фирма SRI International выпус­тившая в 1975 году систему Vici­on Module, обрабатывающую бинарные изображения и став­шую прототипом большинства современных СТЗ. (На основе тех же аппаратно-программных принципов в 1978 году была построена классическая система VS-100, фирмы Machine Intellegence Corp.). Сейчас в промышленности СТЗ используются для контроля качества (первыми определять дефекты на печатных платах предложила фирма Hitachi), отслеживания контуров при механической обработ­ке и дуговой сварке, в задачах сборки и монтажа деталей, конвейерной сортировки, видеонаблюдения и др.

Рынок СТЗ быстро растет. Так, если в 1994 году в США было выпущено около 60000 систем со средней стоимостью 20000 долларов, то к началу XXI века их производство увеличилось в 3,4 раза. В мировом рынке США занимает около 40 %, Японии и Франции по 15 %, Великобритании и Германии по 8 %. Выпуском СТЗ занимает­ся более 200 крупных фирм.

Современные СТЗ классифицируются по трем основным признакам.

  1. По характеру решаемых задач: мощные, средние, малые и персональные.

  1. По структуре вычислительного процесса: однопроцессорные, многопроцессорные, системы на базе матричного процессора, системы поточной обработки.

  1. По типу первичного преобразователя: одномерные или 1D (например, на базе ПЗС-ли­нейки), двумерные или 2D (используются стандартные телекамеры), подвижные двумерные или K2D, трехмерные или 3D (рельефные стереокамеры).

В настоящее время в зависимости от технической задачи и типа датчиков наибольшее распространение получили 5 схем построения СТЗ (табл. 6.1).

Таблица 6.1. Схемы построения СТЗ

Вариант

Тип изображения

Тип вычислительной структуры

Тип датчика

плоское

объемное

последовательная

параллельная

смешанная

цветной

черно-белый

1

+

-

+

-

-

-

+

2

+

+

-

м

-

+

+

3

+

-

-

-

мк

-

+

4

+

+

-

к

-

-

+

5

+

+

-

т

-

+

+

Примечание.

Буквами «м», «мк», «к» и «т» обозначены архитектуры на базе матричного и конвейерного процессоров, транспьютера, а также использующие смешанный «матрично-конвейерный» способ обработки дан­ных.

Наиболее распространенной схемой СТЗ является однопроцессорная схема, которая строится на базе персонального компьютера. Системы такого рода иногда называются персональными (рис 6.2). Более 80% эксплуатируемых СТЗ относятся к однопроцессорным. В ряде случаев, предварительная обработка изображений осуществляется аппаратно, с помощью специализированных устройств ввода - фреймграбберов. Та­к были организованы, в частности, отечественные системы ти­па «Videoscan» и «Megapixel». Однопроцессорная структура относится к первому поколению СТЗ и имеет существенный недостаток - невозможность обработки сложных (в том числе - цветных) изображений в реальном масштабе времени. Относительно низкое быстродействие этих систем обусловлено невозможностью распараллеливания вычислений и отсутствием специальной шины для передачи изображений. Наиболее распространенным путем повы­шения производительности СТЗ явилась идеология фирмы Data Translation (США), предполагающая не только аппаратную филь­­трацию изображений, но и исполь­зо­вание в устройстве ввода программируемых логических матриц, позволяющих изменять алгоритм обработки в зависимости от типа и характера изображения. В большинстве случаев персональная СТЗ включается в состав системы управления соответствующим оборудованием, а ее обучение осуществляется в ручном или полуав­томатическом режиме оператором.

С целью уменьшения времени на пересылочные операции из памяти в процессор и обратно производится разделение потоков информации, т.е. создаются многошинные структуры. При­мером такой СТЗ является модель DT - 100, фирмы Data Tran­slation. Большинство таких систем имеют две шины, по одной передается видеоинформация, по другой управляющие сигналы (рис. 6.3а). Это позволяет совмещать во времени процесс уп­равления системой и передачу данных. С точки зрения организации вычислений сис­тема включает несколько блоков обработки данных (например, однокристальных) БО1 ... БОN. Каждый блок специализирован на определенный круг задач, которые решаются параллельно. Общее управление работой системы осуществляется персональным компьютером. Такая структура тоже не лишена недостатков, которые связаны с наличием конфликтов на шинах. Их разрешение требует, либо организации жесткой приоритетной дисциплины обращения к шинам, либо использования шинного арбитра и диспетчера заданий. Первый способ дает большой выигрыш по быстродействию, но возможен только для определенного класса задач обработки изображений, второй позволяет анализировать любые изображения, но его реализация ведет к временным потерям на анализ изображения, опреде­ление процедур обмена и выдачу текущих заданий блокам обработки данных.

Одним из условий эффективной реализации процесса параллельной обработки, является наличие у задачи свойства «внутрен­него параллелизма», благодаря которому задачи могут быть разбиты на «квазинезависимые» части. В целом, реализация этой концепции требует слишком большого числа вычислите­льных блоков, и поэтому, на существующих параллельных сис­темах используют смешанный последовательно-па­раллель­ный принцип организации вычислений. (Примером этой структуры СТЗ является модель 79а фирмы Kawa­saki).

Вычислительная система на базе матричного процессора осуществляет параллельную обработку данных при полной загрузке процессоров (рис. 6.3б). Такая структура, называемая SIMD (Sin­gle In­struction Multip­le Da­ta) представляет собой мат­­­рицу про­цессор­ных элементов, использую­щих од­но уст­рой­ство уп­ра­вления. Устройство управления формирует единый поток команд ко всем подчиненным процессорам, которые одновременно выполняют одну и ту же операцию, но со своими данными. Анализ подобной архитектуры показывает, что для «квазинезави­­симых задач» она достигает максима­льного быстродействия. Очевидным недостатком СТЗ на базе матричного процессора является их чрезмерная стоимо­сть. Среди известных структур этого типа отметим систему РЕРЕ, использующуюся министерством обороны США для обработки визуальной информации о воздушной обстановке.

Системы на базе конвейерной архитектуры, называемой MISD (Multiple In­struction Single Data), эффективны при обработке массивов данных за длительный период данных. В СТЗ конвейерная (поточная) обработка используется в случае массивов с бо­ль­шим числом элементов поля и числом градаций яркости (рис.6.4). Конвейер состоит из по­следо­ва­тельности про­цессорных элементов, каждый из которых выполняет свою группу операций, а результат появляется на вы­ходе последнего из них. Максимальный эф­фект достигается в случае когда на конвейере одновременно находится p блоков данных, где p - длина конвейера. На прак­тике такая ситуация возможна только на определенном этапе вычислительного процесса, поскольку массивы име­ют конечную размерность и после обработки последнего элемента массива i-ый процес­сорный эле­мент переходит в режим ожидания, в то время как конечный результат будет получен только через p-шагов. В настоящее время известен конвейерный видеопроцессор PIPE для обработки сложных изображений в реальном времени.

Последним достижением в области построения высокоскоростных систем параллельной обработки изображений явилось использование транспьютеров. Транспьютерные системы позволяют на одной и той же аппаратуре формировать раз­личные топологии процессоров («линейка», «кольцо», «дерево», «решет­ка», «гиперкуб» и др.) и различные типы параллельных архитектур (MISD, SIMD, MIMD). Для каждой из задач обработки видео­информации существуют оптимальные топологии, обеспечивающие их эффективное решение. Так, алгоритмам распознавания и идентификации, характеризующимся су­жени­ем потока данных (от большого массива пиксельных данных к данным на уровне объекта) соответствует структура типа «дерево», в корне которого формируется обобщенное описание признаков объектов кадра.

В табл. 6.2 представлены некоторые модели СТЗ, реализованные в рамках рассмотренных схем.

Таблица 6.2. Примеры промышленных СТЗ

Модель

Тип СТЗ

Область применения

Производительность

(тип ЭВМ)

Устройство ввода

Размер кадра, NN

Цена, тыс. $

Cybe Ikon (США)

мощная

космическая съемка

высокая (IBM 370)

сканеры

40004000

До 1000

Magiscan (Англия)

средняя

биология,

ме­дицина

средняя

специальные телекамеры

10241024

До 100

VS - 100 (США)

малая

промышлен­ность

малая (LSI - 11)

промышленные телекамеры

256256

1 … 10

DT - 2871

(США)

персональная

охранные

сис­темы

средняя (PDP, IBM PC)

бытовые теле­ка­меры

512512

0,1 … 1


В робототехнике, как правило, используются достаточно простые схемы СТЗ, поэтому к 2000 году более 70% роботов США оснащались этими средствами. В зависимости от задачи и типа робота наиболее распространены 2D и K2D системы (рис. 6.5). В первом случае, применяются видеодатчики, фор­мирующие плоскую рабочую сцену. Во втором, при сканировании плоской сцены выделяется трехмерная информация. Типичным решением при построении системы управления роботов с СТЗ явилась известная структура «главная ма­шина - сателлит». Здесь инициализация работы СТЗ осуществляется главной машиной, в качестве которой обычно выступает управляющая ЭВМ робота. Вся обработка видеинформации производится в СТЗ (сателлите), которая затем передает в главную машину соответствующие данные. Чаще всего такими данными являются характеристики рабочей сцены, координаты конкретных объектов и т.д. Описанная структура системы управления получила название двухуровневой: на нижнем уровне производится обработка сенсорной информации, а на верхнем - непосредственное управление манипулятором.

Несмотря на свое подчиненное по отношению к главной машине положение, СТЗ способна решать весьма сложные информационные задачи. Преобразование информации в СТЗ обычно представляется в виде последовательности шести основных этапов [ ]:

  • восприятия или ввода информации (т.е. получения визуального изображения с по­мо­щью видеодатчиков);

  • предварительной обработки изображения (пре­­д­полагает использование методов подавления шума и улу­чшения изображений отдельных деталей сцены);

  • сегментации (обычно, выделения на изображении одного или нескольких интересующих объ­ектов);

  • описания (определения характерных параметров объекта: размеров, формы и т.д., необходимых для его выделения из числа всех, об­разующих сцену);

  • распознавания (как этап обработки информации представляет собой идентификацию объекта, т.е. отнесение его к некоторому классу, например, «болт», «блок двигателей»);

  • интерпретации (выявления принадлежности к груп­пе распознаваемых объектов, например, «на сцене есть несколько гаек»).

В соответствии с тем, какие этапы преобразования информации реализуются конкретной СТЗ, она может быть отнесена к мощной, средней или малой (персональной). Так, задачи, решаемые малыми СТЗ (их иногда называют СТЗ низкого уровня), ограничиваются восприятием и предварительной обработкой информации. (По словам К. Фу подобные задачи можно сравнить с теми, что решает человек, пытающийся найти свое место в темном зале кинотеатра, куда он попал с яркой улицы). В СТЗ среднего уровня решаются задачи сегментации, описания и распознавания отдельных объектов. Алгоритмы, используемые на нижнем и среднем уровнях, основаны на традиционных подходах к обработке информации и разработаны достаточно хорошо, в то время как процессы верхнего уровня, в значительной степени, не определены.

6.2. Основы формирования и передачи изображений

На первом этапе преобразования информации про­изводится непосредственно формирование изображения, заключающееся в определении значений яркости L(x, y) каждой конкретной точки изображения. Собственно изображение представляет собой распределение яркости элементов сцены в пространственной области, сигнал же изображения пре­дставляет собой развертку этого распределения в области временной (рис. 6.6). Данные преобразования реализуются разнообразными телевизионными камерами, используемыми также и для передачи изображения на расстояние.

Рассмотрим основные вехи в развитии техники передачи изображений. Первые опытные демонстрации изображений на рас­стоянии были проведены практически одновременно в Англия, США и СССР в 1925 -1926 г.г., а начало регулярного вещания датируется 1928 г. Пионерами были Англия и Германия; вещание в СССР открылось в 1931 г. Первая телевизионная система была оптико-меха­нической и содержала 30 строк разложения изображения. Телевизионные передатчики на этом этапе ничем не отличались от радиопередатчиков и так­же работали в диапазоне звукового вещания. Решительный шаг к созданию первой передающей телевизионной трубки «иконоскопа» сделали В.К. Зворыкин (США) и С.И. Катаев (СССР). Зворыкин был командирован в США в 1917 г. А.Ф. Керенским, добился там значительных результатов и обратно не был выпущен уже американцами. Первая электронная система разложения изображения была реализована с его участием в США в 1936 г. и имела стандарт разложения в 343 строки. В том же году в Англии началось вещание по стандарту 405 строк. Автором этого стандарта стал еще один выходец из России И. Шоэнберг. В 1938 г. вещание по электронной системе с 455 строками открылось во Франции, Гер­мании и Италии (441 строка). Весной того же года на импортном оборудовании по стандарту разложения 343 строки начал вещать СССР. Все указанные системы использовали чересстрочную развертку, однако, осенью на ленинградском телецентре было установлено отечественное оборудование с прогрессивным разложением сигнала на 240 строк. Во вре­мя Второй мировой войны работы продолжались только в США, где и был принят в 1943 г. современный стандарт разложения 525 строк 60 полей/с. В Европе первым возобновил вещание СССР в мае 1945 г., и вскоре у нас был принят стандарт 625 строк 50 полей/с. В настоящее время в мире действуют два стандарта телевизионного разложения: 625/50, охватывающий 150 стран с населением 5 млрд. и 525/60 - 55 стран с населением 1 млрд.

6.2.1. Понятие о видеосигнале

Сигнал яркости (он же сигнал изображения Y) является аналоговым многоуровневым сиг­налом. На рис. 6.6 показано распределение яркости в пределах одной строки растра при передаче простого изображения (черной и белой полос на сером фоне).

Полным видеосигналом называется совокупность сигнала изображения и служебных сигналов. Сигнал изображения строится из сигналов яркости и цветности, служебные сигналы представляют собой набор гасящих, синхронизирующих, уравнивающих импульсов, а также импульсов «врезки».

Принципы развертки сигнала в системах черно-белого и цветного телевидения одинаковые, сигнал цветности лишь «подмешивается» в спектр сигнала яркости. Поэтому при анализе развертки видеосигнала не будем уточнять тип сигнала изображения, а рассмотрим этот вопрос при анализе спектра видеосигнала.

Телевизионное изображение воспроизводится путем последовательного сканирования электронным лучом покрытого электролюминисцирующим веществом экрана. Сканирование происходит слева направо вдоль горизонтальных линий (телевизионных строк) и сверху вниз по строкам. При развертке кад­ра луч пробегает строку за строкой сверху вниз до самого низа экрана, а затем возвращается назад, и вся процедура повторяется со сле­дующим кадром. За счет инерционности глаза в процессе подобного сканирования вызываемые вспышки света сливаются в линии, а затем в полное изображение. В результате полный телевизионный кадр представляет собой совокупность последовательно высвечиваемых линий, передающих пространственное распределение изображения. В большинстве систем используется чересстрочная развертка, когда весь растр разбивается на два полукадра - четный и нечетный. Сначала прочерчиваются нечетные строки, образуя нечетный полукадр, затем луч отклоняется вверх, и прочерчиваются четные. Сигнал яркости, по существу, формирующий черно-белое изображение сцены, образуется во время прямого хода луча развертки на активных строках (рис. 6.7). Во время обратного хода луч гасится, что достигается подачей на прожектор передающей камеры (видеодатчика) и приемной (кинескопа) гасящих импульсов. Длительность стро­­чного гасящего импульса соста­вляет 12 мкс или около 19% периода строки, длительность кадрового гасящего импульса - 1600 мкс, т.е. 8% периода полукадра. В результате действия строчных гасящих импульсов все активные строки на экране разделены тонкими черными промежутками, хорошо видными на близком расстоянии. Кадровые гасящие импульсы образуют широкие промежутки между кадрами, однако, при устойчивом изображении они не видны, т.к. располагаются за пределами поля экрана.

Диапазон яркости определяет разницу между сигналами, соответствующими черному и белому изображениям. Уровень черного составляет 65 ... 70% полной амплитуды сигнала, уровень белого - 10 ... 15% (рис. 6.8). Следовательно, черное передается высоким уровнем. Этот способ кодирования яркости, получивший название негативная модуляция, позволяет снизить среднюю излучаемую мощность, т.к. обычно на изображе­нии преобладают светлые тона. При этом помехи проявляются в виде черных точек, плохо различаемых глазом.

Все служебные сигналы лежат в области «чернее черного». Амплитуда полного видеосигнала (между уровнями черного и синхронизирующих импульсов) составляет 1 В на нагрузке 75 Ом.

Обеспечение синхронной и синфазной работы всех развертывающих схем видеодатчика и кинескопа достигается подачей строчных (в конце прямого хода каждой строки) и кадровых (в конце каждого полукадра) синхроимпульсов. Стандартом установлена длительность кадро­вых синхроимпу­ль­­сов - 160 мкс, строчных - 4,7 мкс. Для обеспечения качественного воспроизведения сигнала (чтобы не было смещения строк в начале развертки полукадров, т.е. излома вертикальных линий в верхней части экрана), а также обеспечения устойчивос­ти чересстрочной развертки, сигнал синхронизации усложняется путем «врезки» сточной частоты в кадровые синхроимпульсы и передачи уравнивающих импульсов. Длительность всех этих служебных сигналов составляет 2,35 мкс.

В отечественном телевизионном стандарте принята чересстрочная развертка видеосигнала, которая по ГОСТ 7845-79 характеризуется следующими параметрами:

  • числом строк разложения в одном кадре Z (Z = 625 твл - телевизионных линий);

  • числом кадров в секунду nк (nк = 25);

  • форматом кадра K (K = 4/3);

  • периодом развертки кадра Tк (Tк = 40 мс);

  • периодом развертки полукадра (поля) Tп (Tп = 20 мс);

  • периодом развертки строки Tс (Tс = 64 мкс). При этом Тс = Тк/Z.

Следовательно, частота развертки полного кадра fк равна: fк = 1/Tк = 25 Гц, частота развертки поля fп = 2 fк = 50 Гц, и, наконец, частота строчной развертки fс = 1/Tс = 15625 Гц.

Номинальное число элементов разложения N по полю зрения телекамеры (при передаче черно-белого сигнала и хорошей четкости изображения) определяется выражением:

N = K Z2 или 4/3 (625)2 = 520833

Частотный спектр видеосигнала характеризуется верхней fв и нижней fн граничной частотой и зависит как от характера изображения, так и от параметров развертки. Нижняя граничная частота соответствует изображению, имеющему минимальное чис­ло изменений яркости. Период этого импульсного сигнала равен периоду полукадра Tп, а его частота - частоте кадровой развертки fн = fп (рис. 6.9а). Следовательно, fп = 50 Гц. (Время смены полукадров в телевизионном стандарте равно 0,02 с, что существенно меньше инер­ционности глаза, составляющей 0,1 ... 0,15 с). Верхняя граничная частота fв соответствует изо­бражению, содержащему максимальное число эле­ментов, яркость которых позволяет раздельно передать камера (рис. 6.9б). Получим fв = N fк = 52083325 13 МГц. Это значение fв применяется при прогрессивной (построчной) развертке. Передача столь широкополосного сигнала вызывает значительные технические трудности, для уменьшения которых, собственно, и была предложена чересстрочная развертка. В этом случае, значение fв уменьшается вдвое:

fв = K Z2 fн/4 = 6,5 мГц

Таким образом, чересстрочная развертка вдвое су­жает спектр сигнала, что весьма существенно при передаче изображений по каналам связи. Обычно в расчетах полагают fв = 6,0 Мгц. При увеличении частоты смены кадров или строк разложения, увеличивается верхний частотный предел fв и расширяется частотный спектр сигнала изображения. (Геометрические размеры каждого элемента разложения d соответствуют высоте строки, которая, в свою очередь, определяется апертурой - размером развер­ты­вающего электронного луча).

Разрешающая способность канала передачи изображений определяется числом строк разложения и шириной спектра видеосигнала. Для принятого в нашей стране стандарта 625 строк и 50 полей 1 МГц частоты видеосигнала соответствует разрешающей способности по горизонтали 78 твл. Следовательно, максимальная разрешающая способность телевизионного изображения по горизонтали ограничена величиной 786,5 = 507 твл. (Обычно считают, что ширина спектра ограничена 6 МГц и тогда 786 = 468 твл). В ряде европейских стран изображение занимает лишь 575 строк из 625. Остальные используются для передачи телетекста. Спектр сигнала яркости при этом соответствует 5 МГц.

Полный телесигнал передается путем АМ несущей частоты, следовательно, его частотный спектр содержит несущую частоту fнес и две боковые полосы. (В отличие от изображения сигнал звукового сопровождения в телевидении обычно пред­ставляет собой ЧМ колебание несущей частоты). Как известно, ширина спектра такого сигнала определяется удвоенной максимальной частотой модулирующего сигнала fв. Поэтому, радиосигнал изображения в отечественном вещании занимает полосу 13 МГц. Для АМ сигнала характерно, что каждая из боковых частот содержит полную информацию о сигнале. Следовательно, без потери качества можно одну из них подавить, сузив, тем самым, и спектр сигнала. Обычно, частично (для сохранения несущей частоты) подавляется нижняя боковая частота (1,25 МГц), верхняя же передается полностью (рис. 6.10). Применительно к телевещанию, это позволяет увеличить число передаваемых каналов в отведенном диапазоне волн. Во всех случаях АМ fнес должна в несколько раз превышать максимальную час­тоту fв спектра модулирующего сиг­нала. Например, в отечественном стандарте наименьшая несущая частота соответствует I частотному каналу и равна 49,75 МГц.

При передаче изображений в телевещании используется 5 полос частот: в диапазоне метровых волн УКВ (I ... III) - размещается 12 каналов, в диапазоне дециметровых волн УКВ (IV и V) - размещается более 73 радиоканалов. Распределение телевизионных каналов по частотам приведено в табл. 6.3.

Таблица 6.3. Шкала распределения радиочастот в телевещании

f, МГц

48,5 ...66

76 ...100

174...230

470 ... 582 ... 960

Полосы частот

I

II

III

IV

V

Телевизионные каналы

I … XII



Перспективные системы телевещания - телевидение высокой четкости используют полосу пропускания до 60 МГц, при этом частота кадров увеличена до 100 Гц. Соответственно, изменены и другие характеристики сигнала: Z = 1125, K = 16/9.

При передаче цветного изображения сигнал цветности должен встраиваться в спектр сигнала яркости.

6.2.2. Принципы кодирования цвета

Термин «цвет» даже в научной литературе имеет несколько определений. Одним из наиболее удачных является формулировка Э. Шредингера, определившего цвет как «свойство спектрального состава излучения, общего излучениям, визуально неразличимым для человека». Подобное представление лежит в основе цветовых измерений (колориметрии) и теории цветного зрения. Особенности спектрального состава излучения изучал в XVIII в. И. Ньютон, определивший отдельные составляющие солнечного света. Основные положения теории цветового зрения были заложены М. Ломоносовым, экспериментально установившим, что все цвета могут быть получены путем сложения трех основных (первичных) цветов. Проведенные в XIX в. исследования Г. Гельмгольца и некоторых других ученых показали, что чувствительность S зрительных клеток к свету различных длин волн неодинакова (рис. 6.11). Многочисленные физиологические эксперименты привели к эмпирической зависимости:

L = 0,59 G + 0,3 R + 0,11 B

где G, R и B - соответственно зеленая, красная и синяя составляющие спектра излучения. Яркость L, как и ранее, характеризует амплитуду черно-белого изображения. Поскольку представления о черном и белом весьма субъективны, возникла необходимость централизовано установить понятие «белого». Согласно принятому международному определению белым цветом называется цвет свечения абсолютно черного тела при температуре 6500 0С.

Формула, определяющая яркость как взвешенную сумму компонентов цветности, лежит в основе наиболее известной модели аддитивного цветового синтеза, применяемой в светоизлучающих системах (в том числе - цветном телевидении). Согласно аддитивной модели, известной также как цветовая система RGB, любой цвет получается наложением красного, зеленого и синего цветов спектра. Так, например, на экране монитора цвет и яркость каждой точки задается интенсивностью R, G и B составляющих, использующихся при управлении мощностью трехкомпонентной электронной пу­шки. Для наглядного представления цветовой системы RGB ис­пользуется цве­товой куб, где чистые цвета образуют вершины куба, а оттенки серого лежат на главной диагонали (рис. 6.12). Однако при всей наглядности этой схемы она имеет два существенных недостатка. Во первых, в системе RGB невозможно получить все цвета путем сложения основных составляющих. Во вторых, цветопередача является аппаратно-зависимой (например, от люминофора). В частности, экспериментально установлено, что методика RGB недействительна в сине-зе­леной (450 ... 550 нм) области. Это связано с тем, что для имитации спектрального цвета в данной области требуется отрицательная крас­­ная составляющая (рис. 6.13). Действительно, согласно цветовому кубу справедливо равенство:

Голубой = Синий + Зеленый

На самом деле, эмпирически установлена спра­ведли­вость другого выраже­ния:

Синий + Зеленый = Голубой + Красный,

что и приводит к появлению отрицательной крас­ной компоненты:

Голубой = Синий + Зеленый - Красный.

Ясно, что в природе не существует отрицательных составляющих цвета, и, следовательно, в модели аддитивного цветового синтеза голубой цвет может быть получен то­лько искусственно.

Модель RGB используется для описания источников излучения. Если же объект освещается, он является приемником света, отражающим волны. Большинство предметов отражают либо солнечные лучи, либо лучи других источников освещения. Так, например, если объект кажется красным, это означает, что он отражает только длинные волны, поглощая все остальные. Для описания приемников света используется модель субтрактивного цветового синтеза, называемая также CMYK (Cyan - голубой, Magenta - пурпурный, Yellow - желтый и Black - черный). Модель CMYK позволяет получить на бумаге большинство необходимых цветов и широко используется в полиграфии и других системах печати. Важной особенностью такого подхода является возможность кор­ректировать цвета изображений. Так, если изображение (фотография) получилось излишне синим, то необходимо увеличить желтую составляющую, поскольку желтый цвет поглощает синюю ком­понен­ту. Аналогично, зеленый цвет корректируется увеличением пурпурной составляющей. На практике, при технической реализации цветной печати изображение раскладывают на голубую, пурпурную и желтую составляющие, образующие на бумаге точечный растр. Затем для увеличения контрастности в растр добавляют чисто черную составля­ющую, которая оказывается гораздо насыщеннее, чем компонента, образованная сложением C, M и Y цветов. Белый цвет соответствует нулевым значениям всех составляющих C, M, Y и K, в отличие от RGB, где все компоненты соответствуют максимуму.

Система CMYK, также как и RGB является аппаратно-зависимой. Более того, цветовое изображение, полученное в CMYK (например, при печати на принтере) не совпадает с изображением в RGB (пред­ставленным на мониторе). Указанные недостатки не позволяют количественно оценивать цветовую информацию, содержащуюся в изображении. Следовательно, возникла необходимость разработки аппаратно-независимых моделей кодирования цвета.

В последние 20 лет для цифровой обработки изображений широко используются аппаратно-незави­симые системы кодирования цвета. К наиболее известным относятся система HSV и ее варианты - HSI, HLS, а также телевизионная система YUV (разработанная для стандарта цветного телевидения PAL). Особенностью всех этих систем является раздельность кодиро­вания сигналов яркости и цвета. Применительно к телевидению такой подход получил название компонентного кодирования.

Принцип HSV (HSI) очень напоминает способ, используемый художниками для получения нужных цветов - смешивание белой, черной и серой красок с чистыми красками для получения различных тонов и оттенков (tine, shade и tone). При этом, цвет задается не смесью трех основных составляющих как, например, в системе RGB, а с помощью трех независимых величин - цветового тона (hue), насыщенности (satura­tion) и интенсивности (value, intensity). В качестве геометрической модели используется конус, получаемый как сглаженная проекция цветового куба RGB вдоль его главной диагонали «черный-белый» (рис.6.14). В соответствии с этой моделью цветовой оттенок (тон) H и насыщенность S кодируются как угловая и радиальная характеристики цветового круга - основания конуса. Тон описывается уг­лом цветовой стрелки (например, красный соответствует 00), насыщенность представляется как величина смещения вдоль радиуса круга. Она возрастает по величине от 0 к 1 (или от 0 до 100%) при перемещении от центра круга к его границе соответственно. Насыщенность характеризует насколько тусклым или «соч­ным» является цвет. Чем больше данный цвет разбавлен белым (чем ближе к центру круга), тем он менее насыщен. Естественные (реальные) цвета имеют низкую насыщенность.

Величина интенсивности (или цвета) V указывает яркость цвета. Она также меняется от 0 к 1, но по оси OV и не связана с цветовым кругом. По этой оси располагаются серые цвета, так, например, для белого цвета имеем: S = 0, V = 1. Следовательно, добавление белого в любой цвет уменьшает S, а добавление черного умень­шает V. В системе HSV при S = 0, Н не имеет смысла. Действительно, как следует из рис. 6.14 эта точка соответствует вершине конуса.

Другая цветовая система HLS или HSB (буквы H и S также обозначают тон и насыщенность, L и В - яркость) использует то же координатное пространство, но представленное в виде двух пирамид, соединенных основаниями (рис. 6.15). Эта фигура в большей степени соответствует диагональной проекции куба. В модели HLS, также как и в HSV черный и белый цвета образуются при любых значениях H и разных L и S, например, насыщенный черный при L = 0, S = 1, а белый - при L = 1 и S = 0. Голубые цвета соответствуют значению H = 1800. Так, грязно-голубому цвету (смеси серого с голубым) отвечает комбинация: L = 0,5, H = 1800 и S = 0, цвету морской волны: L = 0,5, H = 1800 , но S = 1, и, наконец, небесно-голубому: H = 1800 и L и S = 1.

Поскольку в основе геометрических построений в системе HSV и ей подобных лежит модель RGB, то и пересчет цветов в обе стороны до­статочно прост.

Наличие большого количества разнообразных моделей, применяемых в различных задачах обработки цветных изображений, привело, в конце концов, к необходимости создания единого описания цвета. В качестве всемирного стандарта для определения цвета в настоящее время утвержден цветовой график МКО (CIE), сочетающий абстрактный характер HSV и практичность RGB и CMYK. Этот график, предложенный еще в 1931 г. охватывает все цвета, которые способен видеть человеческий глаз (рис. 6.16). График МКО строится как функция двух переменных х и y, представляющих собой некоторые гипотетические (несуществующие в природе) основные цвета. Тогда, на линии, которая ограничивает цветовое пространство МКО, будут находиться все чистые цвета видимого света. Их можно получить путем смешения источников x и y. (Например, чистый красный с длиной волны 700 нм понимается как результат сложения 70% x и 25% y). Все цвета, лежащие внутри графика и на его границе являются физически реализуемыми.

Цветовой охват устройства (телекамеры, монитора, сканера, принтера, фотопленки и пр.) характеризует его способность к отображению цветовой гаммы всего цветового диапазона. Для любого устройства он находится внутри пространства МКО. Самый боль­шой цветовой охват имеет фотопленка.

При передаче цветных изображений в большинстве СТЗ применяются устройства аддитивного цветового синтеза, основанные на модели RGB. (К ним относятся и телекамеры и мониторы). Сигнал яркости Y передается непосредственно, а информация о цвете кодируется двухкомпонентным вектором цве­тности (рис. 6.17). В этой системе, получившей название YUV, к уже известной формуле расчета яркости Y добавляются еще две, опреде­ляющие проекции U и V вектора цветности:

Y = 0,59G + 0,30R + 0,11B, U = R - Y, V = B - Y.

Длина вектора цветности находится через амплитуды его про­екций U и V; она кодирует насыщенность цвета. Фазовый сдвиг между проекциями описывает цветовой тон. В телевизионной технике эти вектора обычно нормируют, и круг превращается в эллипс: U = (R-Y)/1,44 и V = (B-Y)/2,03. На основе системы YUV построены и другие известные модели. Примером может служить система цифрового цветного телевидения YCbCr. (Здесь цветоразностные сигналы Cr и Cb строятся из R-Y и B-Y соответственно).

Рассмотрим формирование цветного сигнала в телевизионной камере. Обычно применяются три развертывающих луча, формирующих первичные сигналы изображения ER, EG, EB соответствующие красной, зеленой и синей составляющим цвета передаваемого объекта. Первичные сигналы широкополосные, однако, ни один из них не несет яркостной информации об объекте. (Иногда вместо тер­мина «яр­кость» исполь­зуется понятия освещенности ). Поэтому в системе цветного телевидения из трех первичных цветов формируется четвертый - сигнал яркости EY, для чего первичные сигналы сначала балансируются, а затем матрицируются. Сущ­­ность данной про­цедуры, учитывающей спектральную чувствительность глаза, описывается уже извес­тной зависимостью: EY = 0,30 ER + 0,59 EG + 0,11 EB, где ER = EG = EB. Этот сигнал передается непрерывно на каждой строке развертки во всей полосе частот видеосигнала 6 МГц и позволяет воспроизводить черно-белое изображение на экранах черно-белых и цветных приемников.

Наличие сигнала яркости EY освобождает от необходимости передачи всех трех первичных сигналов изображения. Обычно передаются два из них ER и EB, а «зеленый» восстанавливается по формуле:

EG = (EY - 0,30 ER - 0,11 EB)/0,59

Важной особенностью зрения является зависимость пространственной разрешающей способности глаза от длины волны - она понижена в области красных и синих цветов. Следствием этого является меньшая чувствительность глаза к пространственным изменениям оттенков цвета, чем к изменениям яркости, что позволяет передаваться цветовую информацию с меньшим разрешением. Таким образом, трехкомпонентная модель цветового зрения распространяется только на относительно крупные объекты. Цвет объектов средних размеров является смесью двух цветов: оранжевого и голубого, а мелкие и вовсе различаются только по яркости, т.е. кажутся черно-белыми. Указанные обстоятельства позволяют сократить полосу частот сигнала цветности до 1 ... 1,5 МГц. Поскольку, полная информация о яркости объекта содержится в сигнале EY, из сигналов ER и EB ее можно исключить, и передать эти компоненты в виде цветоразностных сигналов ER-Y и EB-Y. При таком подходе достигается двойной выигрыш. Во-первых, обеспечивается достоверность воспроизведения цветов, т.к. в реальных объектах значительную часть составляют неокрашенные и слабоокрашенные участки. Во вторых, уменьшается ам­плитуда передаваемых сигналов, что увеличивает энергетическую эф­фектив­ность передачи. Таким образом, исходные RGB-видеосигналы с телекамеры перед передачей преобразуют в сигнал яркости Y и два цветоразностных сигнала U = ER-Y и V = EB-Y (рис. 6.17). Следовательно, полный цветной телевизионный видеосигнал представляет собой композицию трех сигналов Y, U, V и служебных импульсов. Такой сигнал получил название композитного. При приеме в цветном телевизоре осуществляется обратный процесс восстановления (декодирования): R = Y+U (или ER = EY+ER-Y), B =Y+V (или EB = EY+EB-Y) и, наконец, G = Y - 0,509U - 0,194V (или EG = EY - 0,509 ER-Y - 0,194 EB-Y).

В настоящее время в эксплуатации находятся три совместимых системы цветного телевидения:

  • американская NTSC (National Television System Color) - первая система цветного телевидения 1953 г.;

  • германская PAL (Phase Alternation Li­ne - строки с переменной фазой) - разработана фирмой Telefunken в 1963 г;

  • французская SECAM (Sequentiel couleur a mem­oire - последовательная цветная с памятью) - предложена А. Франсом в 1954 г.

В каждой из этих систем используется группа из трех составляющих: сигнала яркости и двух цветоразностных. Сигнал яркости частотно уплотняется цветоразностными сигналами, причем спектры цветности переносятся на поднесущую частоту в области высокочастотной части спектра. (Чтобы не возникало путаницы - несущую частоту цветности, в отличие от несущей яркости, называют поднесущей). Методы кодирования и передачи сигналов цветности в этих системах существенно различаются.

В табл. 6.4 представлены основные технические характеристики систем цветного телевидения.

Таблица 6.4. Системы цветного телевидения

Тип системы

NTSC

PAL

SECAM

Вертикальная частота развертки, Гц

60

50

50

Горизонтальная частота развертки, кГц

15374

15625

15625

Число строк в кадре

525

625

625

Число видимых (активных) строк в кадре

480

576

576

Тип модуляции цветовой поднесущей

АМ

АМ

ЧМ

Полоса видеосигнала, МГц

4,2

5 для B/G, 5,5 для I, 6 для D/K

Частота цветовой поднесущей, МГц

3,60

4,43

4,41 по U, 4,25 по V

Разнос несущих видео/звук, МГц

4,5

5,5 для B/G, 6 для I, 6,5 для D/K

Полная ширина сигнала, МГц

6

7 для B/G, 8 для I/D/K


Система NTSC принята для вещания в США, Канаде, большинстве стран Центральной и Южной Америки, Японии, Южной Корее и Тайване. Именно при ее создании были выработаны основные принципы передачи цвета в телевидении. В NTSC каждая телевизионная строка содержит составляющую яркости Y и два сигнала цветности EI = 0,737U - 0,268V, EQ=0,478U+0,413V. Здесь переход от осей цветового кодирования U, V к осям I, Q обусловлен необходимостью сужения ширины полос цветовых поднесущих до ± 0.5 МГц (в NTSC используется самая узкая полоса видеосигнала). Цветоразностные сигналы передаются путем АМ поднесущих на одной и той же частоте, но с фазовым сдвигом на 90°. Последнее обстоятельство является принципиально важным для разделения сигналов при приеме. Однако из-за неизбежных нелинейных искажений в канале передачи поднесущие оказываются промодулированными сигналом яркости как по амплитуде, так и по фазе. В результате в зависимости от яркости участков изображений изменяются их цветовой тон. Например, человеческие лица на изображении окрашиваются в красноватый цвет в тенях и в зеленоватый - на освещенных участках. Это и является основным недостатком системы NTSC.

В системе PAL используется аналогичная АМ цветоразностных сигналов EU=0,877U и EV=0,493V с фазовым сдвигом на 90°, но через строку дополнительно производится изменение знака амплитуды составляющей EU. В результате при восстановлении в декодере цветовые составляющие надежно разделяются сложением/вычитанием сигналов цветности последовательных телевизионных строк, и паразитная яркостная модуляция приводит лишь к некоторому изменению цветовой насыщенности. Усреднение сигналов двух строк обеспечивает также повышение отношения сигнал/шум, но приводит к снижению вертикальной четкости в два раза. Впрочем, частично это компенсируется увеличением числа телевизионных строк разложения. Система PAL принята в большинстве стран Западной Европы, Африки и Азии, включая Китай, Австралию и Новую Зеландию.

Система SECAM первоначально была предложена во Франции еще в 1954 г., но регулярное вещание после длительных доработок было начато только в 1967 одновременно во Франции и СССР. В настоящее время она принята также в Восточной Европе, Монако, Люксембурге, Иране, Ираке и некоторых других странах. Основная особенность системы - поочередная, через строку, передача цветоразностных сигналов (DR= 1,9U, DB=1,5V) с дальнейшим восстановлением в декодере путем повторения строк. При этом в отличие от PAL и NTSC используется ЧМ поднесущих. В результате цветовой тон и насыщенность не зависят от осве­щенности, но на резких переходах яркости возникают цветовые окантовки. Обычно после ярких участков изображения окантовка имеет синий цвет, а после темных - желтый. Кроме того, как и в системе PAL, цветовая четкость по вертикали снижена вдвое.

Во всех рассмотренных системах к цветному видеосигналу добавляется сигнал звукового сопровождения, образуя так называемый низкочастотный телевизионный сигнал. Этот сигнал передается через эфир путем модуляции несущей частоты одного из 5 допустимых частотных диапазонов (табл. 6.3). И здесь даже в рамках одной системы существуют различия, связанные с конкретной шириной спектра видеосигнала и его разносом со звуковой частью, полярностью амплитудной модуляции радиоканала изображения и типом модуляции радиоканала звука. В табл. 6.5 представлены основные параметры телевизионных стандартов.

Таблица 6.5. Телевизионные стандарты стран мира

Стандарт

Число строк, Z

Ширина кана­ла, МГц

Полоса видео, МГц

Разнос видео/ звук, МГц

Полярность модуляции видео

Тип модуляции несущей звука

A

405

5

3

3.5

+

AM

B

625

7

5

5.5

-

ЧМ

C

625

7

5

5.5

+

AM

D

625

8

6

6.5

-

ЧМ

E

819

14

10

11.15

+

AM

F

819

7

5

5.5

+

AM

G

625

8

5

5.5

-

ЧМ

H

625

8

5

5.5

-

ЧМ

I

625

8

5.5

6

-

ЧМ

K

625

8

6

6.5

-

ЧМ

L

625

8

6

6.5

+

AM

M

525

6

4.2

4.5

-

ЧМ

N

625

6

4.2

4.5

-

ЧМ


В России принят стандарт SECAM D/K (первая буква относится к диапазону метровых волн, вторая - дециметровых), во Франции - SECAM E/L, Иране - SECAM B, Германии - PAL B/G, Англии - PAL A/I, Бразилии - PAL M/M, Китае - PAL D/K, в США, Японии и Тайване - NTSC M/M. Характерные различия модификаций SECAM связаны с особенностями модуляции несущей частоты, как по видео, так и по звуку, а также частотой разноса звука от видео. Сами же низкочастотные телевизионные сигналы одинаковы. В то же время с точки зрения модуляции радиосигналов отличий между PAL D/K и SECAM D/K нет. Это позволяет использовать телевизионный тюнер, настроенный на PAL D/K, для выделения отечественного SECAM из высокочастотного сигнала. Очевидно, что полученный при этом низкочастотный сигнал все же необходимо подавать именно на SECAM-декодер.

В системе SECAM D/K сигнал яркости занимает всю полосу частот - 6 МГц. Информация о цвете передается внутри этого спектра, путем введения в него поднесущих частот, ЧМ цветоразностными сигналами (рис. 6.18). Под­несущие частоты f0R = 4,4 МГц и f0B = 4,25 МГц, на которой передаются цветоразностные сигналы DR и DB, расположе­ны внутри полосы сигнала яркости, т.е. внутри спектра черно-белого сигнала. (Возможность такого уплотнения спектра обусловлена его дискре­тностью и, следовательно, наличием свободных промежутков между соседними гармониками). ЧМ поднесущие передаются поочередно через строку, т.е. в пределах каждой строки развертки передается сигнал яркости и только одна из поднесущих foR или foB. Это вдвое сужает участок спектра сигнала яркости, уплотняемого сигналами цветности, что существенно снижает уровень помех. Однако в одной стро­ке будет отсутствовать красный цвет, а в другой - синий. Чтобы этого не происходило, на приемной стороне задерживают цветную строку с помощью пьезокерамической линии задержки.

ЧМ, с максимальной девиацией 50 кГц, несущая частота радиосигнала звукового сопровождения выбирается на 6,5 МГц выше несущей частоты радиосигнала изображения. Радиосигнал звука занимает полосу частот 0,25 МГц и обеспечивает передачу звуковых частот 30 ... 15000 Гц.

Качество получения телевизионного сигнала в современных СТЗ непрерывно совершенствуется. Разработки ведутся в направлении расширения полосы передаваемых частот, увеличения частоты передачи полукадров с 50 до 100 (с использованием цифровой памяти), расширения уровня черного сигнала, а также применения цифровых методов коррекции.

6.3. Датчики изображений

В настоящее время промышленно выпускается большая гамма датчиков изображений для самых разных целей (производственных, медицинских, военных и др.). Независимо от назначения и принципа действия все они содержат оптоэлектронный преобразователь, служащий для преобразования сфокусированного оптического изображения в электрический видеосигнал. Это изображение формируется в ЧЭ преобразователя, который изменяет свое состояние под действием излучения объекта. Если это излучение лежит в диапазоне видимых волн ( = 0,38 … 0,78 мкм), датчик относится к классу телекамер, если в диапазоне 0,78 … 1000 мкм - к классу ИК камер. Большинство материалов непрозрачны в видимом и ближнем ИК диапазонах спектра, однако, хорошо пропускают СВЧ излучение. Эта особенность используется при разработке разнообразных тепловизионных камер, функционирующих в широком диапазоне длин волн. Так, для традиционных тепловизоров характерно применение волн среднего ИК диапазона (2 … 10 мкм), для которых ткани организма слабопрозрачны. Системы глубокого проникания работают в СВЧ диапазоне ( = 1 … 100 мм), обеспечивая непосредственное изучение теплового режима органов тела. Изменением длины волны излучения можно регулировать глубину зондирования от 200 … 300 мм при = 100мм, до 1 … 2 мм при = 1 мм. При дальнейшем увеличении длины волны разрешающая способность системы падает.

В СТЗ обычно используются телекамеры. Выпускаемые промышленно телекамеры по своим эксплуатационным параметрам разделяют на три класса: «Brand name» (например, японские «Sony», «Panasonic», «Sharp»), «No name», к которым относятся большинство камер, выполненных в виде одной или двух печатных плат, установленных в корпус. Третий класс образуют специализированные телекамеры, разработанные фирмами-ла­бо­Ра­то­риями (например, «Watec», Япония, «ЭВС», Россия). Благодаря наличию специалистов длительное время работающих в данной области, телекамеры таких фирм не уступают, а иногда и превосходят системы «Brand name». В таких лабораториях ведутся разработки новых перспективных СТЗ. Так, в одной из них - Human Interface Technology (США) создана камера нового типа - виртуальный глазной дисплей (Virtual Retinal Display - VRD). Это устройство, имеющее вид очков с угловым полем зрения каждого 1200, содержит три миниатюрных лазера, действующих в красной, зеленой и синей областях спектра. Раз­вертка с частотой кадровой развертки 60 Гц осуществляется прямо на сетчатку глаза.

Датчики СТЗ классифицируются по трем основным признакам.

  1. По размерности: точечные (фотоэлементы), одномерные (линейки) и двумерные (матрицы).

  1. По структуре преобразователя «свет-сиг­нал»: ва­куум­ные (электронно-лучевые трубки) и твердотельные.

  2. По рабочему диапазону длин волн: видимого спектра, инфракрасные (в том числе - тепловые) и специальные.

К основным характеристикам телекамер относятся:

  • разрешающая способность (апертурная характеристика);

  • чувствительность;

  • спектральная характеристика.

Разрешающая способность (разрешение) n характери­зует свойство телекамеры к воспроизведению мелких деталей. Она показывает, насколько четким получается изображение объекта. Обычно, разрешение измеряется в телевизионных линиях - твл - вертикальных полосах, расположенных по экрану телекамеры. На практике n определяется с помощью разнообразных тестовых таблиц, отдельно для черно-белого и цветного изображений. Например, тестовая испытательная таблица ИТМ-05-98 предназначена для визуальной оценки разрешающей способности по цвету по горизонтали и вертикали на соответствие международным нормам и отечественным стандартам. Она позволяет анализировать аналоговое изображение в системах PAL, SECAM, NTSC, RGB, компонентный сигнал Y, R-Y, B-Y, а также цифровые изображения в форматах 4:2:2, 4:2:0, 4:1:1 и т.п. Для современных телекамер n = 380 ... 600 линий и различается по длине и ширине экрана. В направлении кадровой развертки она ограничена количеством строк разложения. Разрешающая способность зависит как от освещенности, понижаясь с уменьшением последней ниже определенного предела, так и от материала мишени (рис. 6.19).

Как уже отмечалось, разрешающая способность глаза (острота зрения) весьма высока и существенно зависит от длины волны (скотопическое и фотопическое зрение). Так, например, в области максимальной чувствительности глаз различает более 600 оттенков серого, при остроте зрения 1'. Что касается хроматической разрешающей способности (разрешение по цвету), то она значительно ниже. Например, применительно к полосам красно-зеленых тонов она в 2,5 раза, а сине-зеленых в 5 раз хуже, чем для черно-бе­лых.

Для бытового телевизионного вещания удовлетворительное изображение получается при 120 ... 150 строках для крупных планов и 250 ... 300 для мелких. Для лучших моделей эти значения выше, однако, существенно различаясь для черно-белого и цветного изображений. Так, для телевизионной трубки (кинескопа) ма­р­ки 54CTV670i-5 разрешение в канале яркости составляет 420 твл, а в канале цветности - всего 60.

Чувствительность телекамеры S (рис. 6.20) характеризуется величиной минимальной освещенности , при которой обеспечивается заданное качество изображения (разрешающая способность или число передаваемых градаций яркости). Заданное качество должно достигаться в достаточно широком динамическом диапазоне освещенностей D = max/min. Телекамера считается хорошей, если этот диапазон составляет 2 … 3 порядка.

Характеристики минимальной освещенности для различных камер выбираются исходя из условий конкретной съемки (табл. 6.6).

Таблица 6.6. Уровни минимальной освещенности телекамер

Обстановка

Освещенность , лк

Сумерки

4

Ясная ночь, полная луна

0,2

Ясная ночь, неполная луна

0,02

Ночь, луна в облаках

0,007

Безлунная ночь

менее 0,002


Отечественным стандартом установлено, что ток сигнала в режиме максимальной чувствительности Smax не должен быть меньше 0,1 мкА при освещенности 1 лк.

Для цветных телекамер характерна существенно меньшая чувствительность (в 5 …10 раз) и разрешающая способность (в 1,5 … 2 раза) по сравнению с черно-белыми камерами. Однако в высокопрофессиональных цветных телекамерах иногда отдельно указывается цветовая чувствительность, определяемая в области максимальной чувствительности. Она определяется как изменение компоненты сигнала цветности при изменении длины волны цвета. У человека эта характеристика весьма высока - в сине-зеленой части спектре глаз фиксирует изменение длины волны в пределах 1 нм.

Телекамеры высокой чувствительности называемые «ночными» обладают чувствительностью в диапазоне 0,005 …0,00004 лк.

Спектральная характеристика телекамеры (рис. 6.21) определяется материалом ее мишени. Промышленно выпускаются телекамеры видимого света, так и рентгеновского, УФ и ИК излучений.

Фирма Sony в 1998 г. разработала портативную камеру специального назначения NightShot, работающую в инфракрасном диапазоне и предназначенную для съемок в кромешной темноте (looking throw camera). Телекамеры подобного типа, оснащенные специальными фильтрами, отсека­ющими часть диапазона видимого спектра, после известных событий 11 сентября установлены в таможенных терминалах США.

Рассмотрение принципов построения телевизионных камер начнем с вакуумных передающих трубок. Вакуумные электронно-лучевые трубки (ЭЛТ) относятся к преобразователям изображения сканирующего типа (в отличие от несканирующих, типа жидкокристаллических, магнитооптических и люминофорных). По способу съема сигнала и типу мишени их принято разделять на следующие классы: диссекторы; суперортиконы (изоконы); видиконы (в том числе плюмбиконы и кремниконы), а также производные от них супервидиконы (секоны) и пировидиконы.

Рассмотрим некоторые популярные вакуумные датчики СТЗ, основанные на различном типе фотоэффекта. К ним, в первую очередь, относятся диссекторы, суперортиконы и видиконы.

Диссектор, схема которого разработана американцем Ф. Фарнсуортом в 1931 г., обладает наивысшей среди всех ЭЛТ разрешающей способностью и чувствительностью. В так называемом режиме «сче­та электронов» возможна регистрация оптических сигна­лов от объектов, освещенность которых не превышает 10-7 лк. (Для сравнения:1 лк приблизительно соответствует освещенности от свечи на расстоянии 1 м). Принцип действия диссектора основан на внешнем фотоэффекте. Его важной особенностью является отсутствие накопления зарядов на фотокатоде, что приводит, в свою очередь, к отсутствию «смазы­вания» изображений движущихся объектов. Благодаря этому диссектор называется «трубкой мгновенного действия». Другое его преимущество связано с возможностью формирования различных траекторий развертки. К недостаткам диссектора относятся сравнительно боль­шие габариты.

Схема суперортикона была предложена в 1938 г. советским физиком Г. Браузе. Прибор представляет собой высо­ко­чув­ствительную ЭЛТ с несколькими каскадами усиления и работает по принципу накопления зарядов. Изображение пе­ре­но­сится с фотокатода на двухстороннюю мишень, считывается с нее медленными электронами и усиливается фотоэлектронным умножителем. Ко­эффициент уси­ления суперортикона достигает 104, что обеспечивает отношение сиг­нал/шум около 100 при освещенности фотокатода 0,1 лк. Суперортиконы, также как и диссекторы, способны работать практически в полной темноте. Их основные недостатки связаны со значительными размерами, малой контрастной чувствительностью и сравнительно невысоким динамическим диапазоном. В настоящее время суперортиконы используются во многих телевизионных системах.

Самый распространенный телевизионный датчик видикон представляет собой малогабаритную ЭЛТ с накоплением заряда, действие которой основано на внутреннем фотоэффекте. Проект видикона был разработан в 1925 г. А. Чернышевым, первая промышленный прибор изготовлен в 1950 г . Сейчас выпускаются несколько типов видиконов, отличающихся характеристиками мишени, системы отклонения луча и др. Известные модели видикона - плюм­бикон и кремникон, отличаются надежностью, высокими фотоэлектрическими параметрами, малыми габаритами и массой, что позволяет их широко использовать в сис­темах цветного телевидения. Луч­шие из видиконов обеспечивают разрешение до 10000 линий. К недостаткам видиконов по сравнению с суперортиконами, относятся меньшая чувствительность и большая инер­ционность.

Видиконы дали рождение другим телевизионным трубкам супервидикону и пировидикону. Первые появились в 60-х годах ХХ века и представляли собой своего рода гибрид видикона с суперотиконом. Они также содержат секцию переноса заряда, что позволяет обеспечить коэффициент усиления свыше 103, уступая в этом только суперортикону, но превосходя его по массогабаритным показателям. Пировидиконы используются в системах тепловидения.

Некоторые параметры рассмотренных вакуумных трубок приведены в табл. 6.7.

Таблица 6.7. Сравнительная характеристика некоторых типов вакуумных телекамер

Тип

Принцип действия

, мкм

n, твл

Отношение

сигнал/шум

, лк

min/max

, мм

(m, кг)

диссектор

внешний фотоэффект

0,4 ... 0,8

125 ... 3500

18 ... 50

5 10-6/5

25

суперортикон

внешний фотоэффект + каскадное усиление

0,25 ...1,2

500 ... 1000

3 ... 80

2 10-3/100

80 (0,5)

видикон

внутренний фотоэффект

0,1 ... 2,5

400 ... 800

2 ... 50

0,1/1000

13 (0,02)


6.3.1. Видикон

Рассмотрим самую распространенную вакуумную телекамеру - видикон (В). В представляет собой вакуумную колбу, в которой находится фоточувствительная мишень ФМ, прожектор и электронно-оптическая система развертки луча (рис. 6.22). ФМ нанесена на торцевую поверхность оболочки В и содержит сигнальную пластину СП (прозрачный электрод, имеющий вывод наружу). Каждый элемент ФМ, материалом которой служат тонкие - около 5 мкм слои полупроводника (аморфного селена, трёхсернистой сурьмы, окиси свинца и ряда других, включая германий и кремний) изменяет свое сопротивление при внутреннем фотоэффекте. От толщины и свойств материала фотопроводника зависят чувствительность, спектральная характеристика и инерционные параметры прибора.

Работает В следующим образом. Развертывающий электронный луч термокатода ТК, уско­ряясь анодами А1 и А2, проходит через сеточный анод А3 и достигает поверхности ФМ, в результате чего на внутренней поверхности фотопроводника в некоторой его точке создается по­тенциал, близкий к потенциалу катода, а между противоположными поверхностями фотопроводника устанавливается разность потенциалов. Далее луч (толщина которого составляет 30 мкм) уходит с этой точки ФМ и освещает следующую точку и т.д. Если на ФМ проецируется изображение, то проводимость различно ос­вещенных участков слоя будет нео­динаковой - возникает рельеф проводи­мости, соответствующий рельефу яр­ко­сти объ­екта. В течение некоторого промежутка времени , определяющего ине­рционность В, каждая из элементарных емкостей (точек экрана) разряжается до оп­ределенного значения, зависящего от ее освещенности - возникает по­тенциальный рельеф. Электронный луч при развертке доводит поверхность всех участков ФМ до одинакового потенциала. При этом, выравнивая потенциалы, луч оставляет на более освещенных участках слоя большее количество эле­ктронов. Таким образом, ток доза­рядки элементарных емкостей несет в себе информацию о распреде­лении освещенности на ФМ. Про­текая, через нагрузочное сопротивление Rн, он создает напряжение видеосигнала. Формирование луча осуществляется прожектором, включающим ТК (эмиттер электронов), модулятор М, управляющий величиной тока (вплоть до запирания прожектора) и двух анодов А1 и А2. Анод А3 представляет собой мелкоструктурную сетку, находящуюся под напряжением, в 1,5 …1,7 раза превышающим напряжения анодов прожектора, что обеспечивает перпендикулярный подход электронов луча по всей поверхности ФМ. Развертка луча осуществляется фокусирующе-отклоняющей системой ФОС, состоящей из системы катушек ФК, КК (корректирующей) и ОК. В зависимости от способа фокусировки и отклонения промышленно выпускаются В с магнитным и электростатическим управлением лучом. (Примерами являются отечественные модели ЛИ 427 и ЛИ 420 соответственно). В робототехнике перспективно использование электростатических ФОС, позволяющих увеличивать скорость развертки при сохранении высокой линейности отклонения луча и реализовывать нестандартные виды развертки (спи­ральную, радиальную).

Характеристики некоторых моделей В представлены в табл. 6.8. Обозначено: ном и max номинальная и максимальная освещенности, Iс - ток сигнала,  - рабочий диапазон длин волн. Под инерционностью понимается уровень остаточного сигнала Iс ост по истечении 40 мс после прекращения освещения мишени. (Например, для ЛИ-421 это означает, что Iс ост = 0,04 мкА).

Таблица 6.8. Примеры промышленных В

Модель  

Тип

мишени 

ном, лк

(max, лк)

Инерционность, % через 40 мс

Iс, мкА

, нм

Тип ФОС

, мм

ЛИ-421

Sb2S3

1 (1000)

40

0,1

400 ... 750

Ф-Н, О-Н

26

ЛИ-426

Sb2S3

1 (10000)

45

0,1

400 ... 750

Ф-Е, О-Н

26

ЛИ-439

Si

1 (1,2)

8

0,3

400 ... 1100

Ф-Н, О-Н

26

ЛИ-465

CdSe

1 (2)

18

0,08

400 ... 800

Ф-Е, О-Е

13,6

ВКБ-102


0,7

Разрешение по горизонтали - 600 твл

2040100

Примечания.

  1. В типе ФОС обозначено:

Е - электрическая напряженность поля, Н - магнитная. Например, Ф-Е - фокусировка луча - электростатическая, О-Н -отклонение луча - магнитное.

  1. Модель ВКБ-102 - охранная система.

В и их разновидности до настоящего времени широко используются для получения высококачественных изображений. Их достоинства: высокая чувствительность и разрешающая способность, широкий температурный диапазон (-80 … +1200С), радиационная стойкость. К недостаткам В необходимо отнести инерционность изображения, значительные габариты и хрупкость. Для современных систем промышленного телевидения разработаны малоинерционные В - кремниконы, в которых на мишени не образуется зарядовый рельеф и развертывающий луч «считывает» лишь сопротивление ее отдельных участков. В широко используются в машиностроении, металлургии, медицине, криминалистике и т.д. в задачах автоматизации операций контроля процессов прецизионной сборки, экспертизы документов, контроля температурных режимов и пр.

Испытания на радиационную стойкость показали надежную работу В при максимальной дозе до 105 рад.

Дальнейшее развитие вакуумных передающих и приемных телекамер происходит в направлении повышения разрешающей способности, яркости и контрастности изображения, улучшения цветопередачи, а также линейности и сведения по всему полю экрана (преимущественно для приемных трубок - кинескопов). Так, увеличение разрешения и яркости (что позволяет увеличить размеры экрана кинескопа до 1 м и более) достигается уменьшением площади триад люминофора с соответствующим уменьшением ячеек теневой мас­ки. Шаг маски и шаг апертурной сетки в трубках типа тринитрон составляет менее 0,25 мм. Наибольшая разрешающая способность 1000 твл до­с­тигается в трубках с дельтавидным расположением электронных прожекторов и точечной теневой маской. Кроме того, для уме­ньшения температурной деформации маски ее изготавливают из инвара (Fe-Ni), имеющего очень малый коэффициент температурного расширения. Такие модели получили название Super Visual. Улучшение четкости изображения достигается уве­личением ускоряющего напряжения трубки. Что касается повышения контрастности, то для этой цели применяют тонирование стекла кинескопа, при котором уменьшается отражение света (трубки Black Trini­tron). При этом контрастность возрастает на 30 … 60%.

Бурное развитие полупроводниковой технологии в конце ХХ века привело к появлению и активному внедрению твердотельных телекамер. Их принято разделять на два ос­новных класса:

  • ПЗС камеры;

  • камеры на базе фотодиодных (фото­транзистор­ных, и иногда фоторезисторных) матриц.

Сравнительные характеристики этих систем представлены в табл. 6.9.

Таблица 6.9. Сравнительная характеристика твердотельных телекамер СТЗ

Тип ЧЭ

, мкм

Smax, интегральная

Размер элемента, мкм

Шаг, мкм

Размерность,

NN

fсч, кГц

фоторезистор

0,4 ...30

1000 В/Вт

1560

50

6464

10

фотодиод

0,4 ... 1,1

25 мА/Лм

432

70

128144

1000

фототранзистор

0,4 ... 1,1

1000 мА/Лм

832

50

128144

100

ПЗС

0,4 ... 1,3

0,1 А/Вт

36

8

795596

1000


Наибольшее распространение получили телевизионные системы на базе ПЗС камер.

6.3.2. Телекамеры на основе приборов с зарядовой связью

В основе работы приборов с зарядовой связью (ПЗС) лежит принцип хранения локализованного заряда в потенциальных ямах, образуемых в полупроводниковом кристалле под действием внешнего поля и передачи этого заряда из одной потенциальной ямы в другую при изменении управляющих воздействий.

Идея ПЗС была выдвинута в 1970 г. американцами У. Бойлем и Д. Смитом, и в настоящее время устройства на ПЗС-стру­ктурах используются во многих областях эле­ктроники. На их основе создаются ОЗУ большого объема, фильтры, линии задержки и др. Исключительно перспективно их применение и в качестве приемников изображения. Главные достоинства ПЗС - жестко заданный геометрический растр, исключающий проблему геометрических искажений, относительная температурная стабильность параметров, надежность. Первые фо­точувствительные ин­тегральные схемы на ПЗС появились в 1977 году. Однако долгое время их использование было прак­тически невозможным в связи с очень низкой чувствительностью, причем различной в красной, синей и зеленой частях спектра. Тем не менее, к середине 90-х годов ХХ века поч­ти по всем техническим параметрам ПЗС камеры (в зарубежной литературе CCD камеры) превзошли телекамеры на ЭЛТ трубках. Возможность миниатюризации камерных головок привела к появлению новых аппаратов - записывающих телекамер - комкордеров (от англ. CAMera + RECorder).

В настоящее время промышленно выпускаются твердотельные передающие камеры на базе ПЗС мат­риц, содержащие более 600000 элементов и ПЗС ли­неек с 8192 элементами. Размер ПЗС матрицы описывается параметром, называемым «формат», который соответствует ди­а­гонали В, эквивалентного дан­ной матрице. Он измеряется в дюймах и принимает значения: 1’’, 2/3’’, 1/2’’, 1/3’’, 1/4’’. Последние модели «Sony» имеют формат 1/4’’. Габариты ПЗС камер существенно меньше, чем В. Так, плоская черно-белая камера компании Watec WAT-600 имеет размер 292916 мм, цилиндрическая черно-белая камера WAT-704 имеет диаметр 18 мм, цветная камера с вынесенной головкой El­mo QN401E имеет диаметр 7 мм. Размер матрицы влияет на угол поля обзора: при одинаковых объективах камера 1/2’’ имеет больший угол, чем камера с матрицей 1/3’’.

Разрешение современных черно-белых ПЗС камер составляет 380 ... 470 твл. Камеры с высоким разрешением (TSR-480 японской фирмы Elmo с 590 твл) позволяют четко видеть мелкие детали: номера машин, лица и т.д. Разрешение серийных цветных ПЗС камер несколько хуже: 300 ... 350 твл, хотя все эти показатели определяются технологическими факторами, ограничений которых не видно. Так, уже появляются цветные ПЗС камеры с разрешением 470 … 500 твл (SSC C370P фирмы Sony, TSP-482 фирмы El­mo).

Рассмотрим принцип действия ПЗС матрицы. Основными элементами ПЗС являются МОП-емкости (емкости, образованные структурой металл-окисел-проводник) или контакты с барьером Шоттки. Эти дискретные элементы располагаются максимально близко друг к другу, так, чтобы их потенциальные ямы сливались, образуя, тем самым, зарядовую связь. В то же время, самопроизвольного «растека­ния» зарядов между отдельными элементами быть не должно, для чего они разделены стоп-каналами. На рис. 6.23 показана структура и временные диаграммы работы трехфазного элемента ПЗС.

Принцип действия устройства основан на накоплении и хранении заряда внутри p-n перехода, который образуется при подаче на металлический электрод на поверхности полупроводника положительного напряжения 10 ... 15 В. (В этом случае, основные носители - «дырки» уходят вглубь полупроводника, и в его толще индуцируется p-n переход).

Каждый элемент (ячейка) матрицы включает 2 ... 3 электрода (количество электродов определяется числом фаз уп­равления) и участок подложки в их окрестности. При определенных фазовых напряжениях под электродами поочередно создаются области, обедне­н­ные основными носителями и являющиеся потенциальными ямами для неосновных носителей, благодаря чему индуцированный p-n переход начинает работать в режиме накопления заряда. В телевизионных системах образование заряда связано с изме­нением освещен­ности ПЗС элемента. Заряд появляется при выбивании квантами света электронов из атомов полупроводника, в результате чего свободные электроны устремляются к p-n переходу, отыскивая положительные дырки и создавая ток через него.

Один из электродов делается прозрачным в видимой части спектра. От его материала в значительной степени зависит спект­ральная чувствительность ПЗС матрицы. Синтез материала электрода представляет собой сложную технологическую задачу. (Обычно используют поликристаллический кремний, недостатком которого является низкая чувствительность в синей области). Далее, часть свободных электронов рекомбинирует с дырками частично разряжая МОП-емкость, а оставшийся заряд выводится в закрытую от света зону. Перемещение заряда осуществляется уп­­рав­ляющими электродами по принципу «бегущей волны» Ф1 - Ф2 - Ф3, когда потенциальные ямы образуются поочередно под 1, 2, 3 электродами (рис. 6.23б). Аналогичным образом осуществляется перемещение заряда дальше по кристаллу. Так, например, для вывода заряда за пределы светочувствительного слоя и записи нового состояния освещенности напряжение понижается на Ф3 и повышается на Ф1 (при этом под первым электродом формируется потенциальная яма).

По своей структуре ПЗС матрицы разделяются на три группы:

  • матрицы с переносом кадра;

  • матрицы с построчным переносом зарядов;

  • матрицы со строчно-кадровым переносом.

Во всех случаях она содержит светочувствительную секцию (или секцию накопления - СН; в некоторых схемах эти секции разделены), секцию хранения СХ, сдвиговые регистры СР (или секции переноса), а также выходной регистр ВР и видеоусилитель ВУ.

Поскольку перенос заряда должен осуществляться в полной темноте, в первых матрицах каждая строка считывалась в активном интервале, а экспозиция (освещение ячейки) осуществлялась во время гасящего импульса. Столь ограниченное время экспозиции приводило к низкой светочувствительности матрицы, и решено было увеличить время экспозиции и снизить время переноса заряда в защищенную от света область. Для этого потребовался накопитель информации, позволяющий сохра­нять заряд долгое время. Он был реализован в конструкции линейной матрицы с двумя параллельными цепочками - одна ис­пользуется в качестве СН, другая - СР. Результатом явилась матрица с построчным переносом зарядов, разработанная фирмой Sony, и широко используемая в недорогих телекамерах (рис. 6.24б). СН и СХ совмещены в одну секцию, чувствительные ячейки которой примыкают к вер­тикальным регистрам сдвига СР и по которым они перемещаются к горизонтальному ВР и ВУ. К недостатку схемы относится сильная чувствитель­ность к ярким фрагментам - так называ­емые «столбы».

В ПЗС с кадровым переносом (рис. 6.24а) заряд из секции накопления СН за время переноса сдвигается в секцию хранения СХ. В течение считывания следующего ка­дра в СН зарядовый рельеф предыдущего вводится по­­строчно в ВР. Первые камеры делали именно по этой схеме (так называемые RCA ка­меры). До сих пор фирма Philips выпускает RCA ка­меры. Недо­статком схемы является необхо­димость в двойном количестве ПЗС элементов.

ПЗС матрицы со строчно-кад­ро­вым­ переносом используются в камерах высшего класса (рис. 6.25). Базовой моделью явилась студийная телекамера BVP-50 фирмы Sony. Как известно, телевизионный стандарт предусматривает ре­жим чересстрочной раз­­вертки, когда поочередно выводятся чет­ный и нечетный полукадры. Рассмо­трим процедуру вывода нечетного полу­ка­дра в матрицах со строчно-кад­ро­вым переносом. Сна­чала, сигнал Фн ге­не­ратора тактовых импу­ль­сов ГТИ ини­циирует параллельный перенос зарядов, содержащихся в светочувствительных элементах нечетных строк каждого столбца в секцию накопления СН. Затем, фазами Фв1 ... Фв3 заряды, принадлежащие одному полукадру, из СН переносятся в секцию хранения СХ регистрами вертикального сдвига РВС. Далее, сигналами Фг1 и Фг2 ГТИ заряды, соответствующие нечетному полукадру построчно перемещаются вдоль ВР (он называется также регистром горизонтального сдвига РГС) и последовательно подаются в выходной каскад, содержащий транзистор сб­ро­са ТС и выходной транзистор ВТ. Наконец, весь процесс повторяется для четного полукадра. Перенос зарядов и сброс из СХ в ВР выполняется в интервале гасящего импульса, а считывание из СН - в интервале следующей экспозиции.

Изменение потенциала затвора ВТ вызывает появление видеоимпульса на выходе всего устройства и матрицы в целом. Выходной каскад (так называемая плавающая диффузионная область - ПДО) преобразует видеосигналы из формы зарядов в форму напряжений. Заряд инжектируется в ПДО путем кратковременного открытия канала ТС. Частота сдвиговых сигналов в регистрах ПЗС связана с темпом вывода видеосигнала и всего кадра. Ее величина определяется необходимостью сопряжения со стандартным телевизионным оборудованием и зависит от размерности матрицы (числа столбцов и строк) и частотных свойств полупроводника. Тактовая частота ВР в разных ПЗС матрицах варьируется в широких пределах 10 кГц ... 10 мГц.

В табл. 6.10 представлены некоторые характеристики отечественной ПЗС матрицы К1200ЦМ7.

Таблица 6.10. Технические характеристики ПЗС матрицы

Параметры

СН

СХ

ВР

Количество строк

Модель

Размерность

Кол-во

элементов

Размер,

мкм

Кол-во

элементов

Размер,

мкм

Кол-во

элементов


К1200ЦМ7

576360

207360

288360

103680

1819


103680

2121


362

576



Уменьшение габаритов матриц со строчно-кад­ро­вым переносом достигается использованием технологии HAD (Hole Accumulated Diode) фирмы Sony, в которой заряд переносится не в сторону от светочувствительной ячейки, а внутрь кристалла. В технологии Hyper HAD, также предложенной фирмой Sony, каждый элемент матрицы содержит микролинзу, что вдвое увеличивает светочувствительность матрицы.

Функциональная схема телекамеры на основе ПЗС представлена на рис. 6.26. Синхрогенератор СГ задает тактовую частоту управления СХ, СН и ВР. Выходной каскад, включающий ПДО и ВУ, преобразует заряды ПЗС ячеек в последовательность видеоимпульсов. Усилитель-смеситель УС служит для усиления видеоимпульсов и подмешивания в сигнал гасящих и синхронизирующих импульсов, формируя композитный видеосигнал.

Существенным недостатком современных ПЗС камер является их меньшие, по сравнению с ЭЛТ, чувствительность и разрешающая способность. Самые чувствительные ПЗС камеры, по аналогии с В называемые «ночными», способны работать при уровнях освещенности до 0,005 … 0,00004 лк, что соответствует освещенности от звезд, частично закрытых облаками. Что касается разрешения, то телекамера стандартного разрешения с числом элементов по строке около 500 имеет реальную разрешающую способность всего 380 твл. Это значение, получается умножением числа элементов матрицы ПЗС на технологический коэффициент 0,75. Однако даже такое значение превосходит разрешающую способность большинства стандартных видеомагнитофонов. ПЗС камеры высокого разрешения с 760 элементами на строке имеют разрешающую способность примерно 570 твл.

Формат телекамеры непосредственно связан с размером используемого объектива. Самыми распространенными и дешевыми являются черно-белые ПЗС камеры стандартного разрешения и форматом 1/3". Четвертьдюймовые камеры используются в системах видеонаблюдения. Для телекамер форматом 1/2" характерно более высокое отношение сигнал/шум, достигающее при дневной освещенности значения 55 … 60 дБ.

Примеры выпускаемых телевизионных ПЗС камер представлены в табл. 6.11.

Таблица 6.11. Примеры промышленных ПЗС камер

Модель

Тип

Количество элементов

min, лк

f, МГц

P, Вт

Uип, В

Размеры, мм

КТЛ-3

линейка

8000


0,4

3,0

15

38135

КТН-15

матрица

512582 (380 твл)

0,5

7,0

5,0

15

3442110

WM-202R

матрица

«глазок»

380 твл

0,8


1,2

12

2450

SSC-M370

матрица

752582 (570 твл)

0,08


2,3

12

6457155

WAT-704R

матрица

537597 (380 твл)

0,8


1

9

1850

WAT-205A

матрица

цветная

537597 (320 твл)

8


1,5

6

454729

Примечание. Модели SSC-M370 и WAT разработаны фирмами Sony и Watec, Япония.

Самая маленькая цифровая фотокамера, разработанная фирмой Sony, весит 26 г., имеет ОЗУ емкостью 64 МБ и способна хранить около 1000 фотографий.

Различные системы на основе ПЗС матриц и линеек нашли широкое применение в самых различных областях. Не рис. 6.27 в качестве примера показано использование ПЗС линейки в системе управления оптическим фокусом видеокамеры. Схема этого устройства похожа на схему устройства автофокусировки головки наведения (рис. 5.78). В одном из наиболее известных решений, известных как TCL (Thro­ugh the Camera Lens), луч света прошедший сквозь объектив направляется полупрозрачным зеркалом на датчик - линейку ПЗС. При этом из пучка лучей, образующих изображение объекта апертурной маской выделяются два крайних, которые разделительными линзами фокусируются в плоскости ПЗС датчика. Разница между полученным сигналом и опорным, записанным в па­мяти микропроцессора камеры, является сигналом уп­рав­ления приводом объектива.

Подведем итоги. Достоинствами телевизионных ПЗС камер являются: высокое быстродействие (малая инер­ци­он­ность), возможность фиксации (запоминания) изо­бра­же­ния, высокая линейность по полю, устойчивость к внешним возмущающим воздействиям, а также малые габариты и вес. Недостатками - меньшая чувствительность и разрешаю­щая способность, чем у вакуумных трубок и геометрический шум.

6.3.3. Фотодиодные матрицы

Наряду с телекамерами на ПЗС структурах нашли распространение и фотодиодные матрицы (ФДМ), также работающие на принципе накопления зарядов. Их главным достоинством является возможность поэлементной адресации и параллельного вывода данных. В основе работы ФДМ лежит свойство p-n перехода, находящегося под обратным потенциалом накапливать заряд, пропорциональный падающему на переход потоку электронов. ФДМ широко используются в оптических преобразователях, сканерах, принтерах и др.

Основой ФДМ является ячейка, содержащая фотодиод и три МОП-транзистора V1, V2 и V3 (рис. 6.28). В начале цикла записи на транзистор V1 поступает импульс стирания Uст открывающий транзистор в результате чего барьерная емкость фотодиода заряжается напряжением по цепи +Eсм - Eп. После закрытия V1 барьерная емкость разряжается фототоком, причем, чем выше освещенность ячейки, тем быстрее происходит разряд. Если через определенный промежуток времени tнак. на транзистор V2 подать адресный импульс Uа (режим вывода сигнала), то по цепи V3 - V2 потечет ток от источника -Еп. Величина этого тока зависит от степени открытия V3 потенциалом на емкости фотодиода (т.е. от остав­шегося через время tнак заряда на фотодиоде). Таким образом, выходной сигнал ячейки зависит от ее освещенности , а совокупность сигналов ФДМ дает информацию о распределении света на ее чувствительной поверхности (рис. 6.28).

Новый цикл записи начинается подачей очередного импульса стирания от внешнего формирователя на общую (для всех ячеек шину), при этом полностью заряжаются емкости фотодиодов, «сти­рая» сохранившиеся на них потенциалы. Время tнак определяет накопленную ячейкой энергию светового потока Ф и, сле­довательно, ее фоточувствительность.

Как уже отмечалось, функция преобразования фотодиода близка к линейной (рис. 6.29).

Схема телекамеры на основе ФДМ представлена на рис. 6.30. Основной режим работы телекамеры - «счи­ты­ва­ние с накоплением». В этом режиме, после короткого импульса стира­ния Uст, в течение ин­тервала времени tнак про­исходит «запись» распределения освеще­н­ности на ячейках, после чего на выбранную стро­ку поступает адре­сный им­пульс и на выходных ши­нах одновременно во­з­ни­ка­ют потенциалы яче­­ек этой строки. Таким образом, организуется параллельно-после­дова­те­ль­ное считывание инфо­р­мации. (Па­рал­лель­но - эле­менты строки, последовательно - строки, причем в произвольном порядке).

Частота вывода кадров fк в этом режиме определяется величиной tнак и варьируется в диапазоне 200 ... 5000 Гц. Задающий генератор устанавливает частоту следования управляющих импульсов, а схема уп­равления определяет режим работы камеры. Дешифратор-формиро­ватель адреса устанавливает амплитуду и длительность адресных импульсов и ра­спределяет их по адресным входам ФДМ в соответствие с заданным порядком считывания (по­­добно считыванию из ОЗУ). Данные из яче­ек поступают через уси­лители считывания и АЦП в буферное устро­й­ство, используемое для согласования после­довательности и ско­рости вывода данных из камеры и их ввода в процессор обработки изображений.

Фотодиодные телекамеры используются в специальных задачах робототехники. Достоинствами ФДМ являются возможность поэлеме­нтной адресации, высокое быстродействие, малые масса и габариты, высокая механическая прочность и надежность. К недостаткам ФДМ следует отнести в первую очередь, малую разрешающую способность, а также геометрическую неоднородность (вслед­ст­вие различия фотоэлектрических ха­рак­теристик отдельных ячеек).

Рассмотренные выше три типа телевизионных датчиков являются базовыми при построении СТЗ. В табл. 6.12 представлены их некоторые сравнительные характеристики.

Таблица 6.12. Сравнительные характеристики отечественных датчиков СТЗ

Модель

Тип

, лк

n*,

твл/мм

, %

, мкм

Размер кадра, NN

Отношение

сигнал/шум

m, г

V, см3

ЛИ-427

ЭЛТ (В)

1 ... 200

50

2

0,4 ... 0,8

500500

80

50

10

ЛИ-214

ЭЛТ (С)

10-5...10

50

2

0,4 ... 0,55

500500

100

500

100

1200ЦМ7

ПЗС

0,1 ... 20

30

2

0,4 ... 1,1

360576

100

5

0,5

ФМ-100

ФДМ

0,1 ... 200

15

3

0,4 ... 1,1

100100

50

5

0,5


6.4. Устройства ввода и хранения изображений

Рассмотренные выше вопросы преобразования информации в СТЗ были посвящены принципам получения изображений в видеодатчике СТЗ - телекамере. Этот этап, называемый восприятием, выполняется, вообще говоря, безо всякого участия вычислительных средств. Остальные же этапы (предварительная обработка, сегментация, описание и т.д.) пред­пола­гают использование вычислительных ресурсов СТЗ. В этой связи, особое значение приобретает правильное построение ус­тройств ввода изображений (фремграбберов, от англ. framegrabber - «захват изображения»), осу­щест­вляющих ввод и фильтрацию видеоинформации, и определяющих форму представления и способ обработки дан­ных в процессоре СТЗ. (Первый промышленный фрейм­граб­бер выпустила фирма Data Translation, США).

Конструктивно устройство ввода обычно выполняется в виде печатной платы, установленной на шине компьютера СТЗ, на входной разъем которой поступает стандартный видеосигнал. Выходная информация зависит от назначения и сло­жности устройства ввода. В ряде случаев это просто интерфейс между телекамерой и компьютером, в других - блок предварительной обработки, выполняющий значительную долю функций СТЗ (рис. 6.31). Структура интерфейса, а также объем требуемой памяти для хранения изображений в значительной мере определяются видом представляемой информации (строка, бинарный массив, полутоновое или цветное изображение), а также типом телевизионного датчика. Хотя в большинстве случаев выходным сигналом датчика является стандартный видеосигнал, характеристики интерфейса зависят от размерности кадра изображения и от того, черно-белое или цветное изображения подлежат обработке. Так, например, передача одного кадра бинарного изображения сравнительно небольшого формата 256256 в стандартном телевизионном режиме требует ввода в память около 3,3 106 элементов изображения в секунду, а обработка цветного изо­бражения того же формата требует пропускной способности канала не менее 10 Мбайт/c. Для современных неспециализированных ком­пьютеров такая задача в реальном времени тру­дно выполнима. Для ее упрощения довольно часто используется буферизация (и «медленный ввод», например, по половине кадра), либо аппаратная выборка графического (контурного) изображения, при которой из полного массива выбирается только самая необходимая информация. Другими словами, ввод видеоинформации, а также и другие эта­пы преобразования (реализуемые программными средствами) могут рассматриваться как последовательное уменьшение размерности информационного массива, т.е. сжатие информации.

Основными задачами фреймграббера являются: кодирование видеосигнала (в том чи­сле его квантование и дискретизация), частотная фильтрация («сглаживание» изображения), буферизация и ввод массива данных.

Кодированием видеосигнала называется про­цедура представления черно-белого или цветного изображения дискретным массивом двоичных данных, однозначно соответствующим исходно­му.

Процедура кодирования включает дискретизацию (рис. 6.32) - час­тотное преобразование непрерывного видеосигнала в пи­ксельный и кван­тование - амплитудное преобразование си­г­на­лов яркости и цветности (рис. 6.33).

Дискретизация - представление непрерывного аналогового сигнала последовательностью его значений (отсчетов). Эти отсчеты берутся в моменты времени, отделенные друг от друга интервалом, называемым периодом дискретизации Tд. Дискретизация является преобразованием по полю; она реализует преобразование развертки видеосигнала Uс(t) в решетчатую функцию Uс [T] (обычно 100 нс < Tд < 1,5 мкс). Функция преобразования при дис­кретизации имеет вид:

Uс (t) Uс [T] Umn,

где m и n - дискретные отсчеты абсциссы x и ординаты y отдельных точек свето­чув­ствительной поверхности телека­меры (они однозначно определяются через периоды строчной и кадровой разверток). Для цветной телекамеры мы имеем дело с тремя преобразованиями, и для каждой компоненты получим:

UY (UY) mn, UU (UU) mn, UV (UV) mn.

Здесь индексы Y, U, V - определяют соответствующую компоненту полного видеосигнала.

Чем меньше период Tд и выше частота дискретизации fд = 1/Tд, тем меньше различия между исходным сигналом и его дискретизированным значением. Сту­пенчатый вид дискретизированного сигнала может быть сглажен фильтром ни­жних частот, с помощью которого обычно и осу­­ществляется восстановление аналогового сигнала из дискретизированного. Однако при восстановлении необходимо выполнения известное ограничения: fд 2fmax, где fmax - верхняя частота спектра исходного аналогового сигнала (это условие определяется известной теоремой Найквиста-Котель­никова). Если это условие не выполняется, то дискретизация сопровождается необратимыми искажениями. Примером искажений, связанных с недостаточно высокой частотой временной дискретизации (в том числе с частотой кадров разложения), является картина движущегося велосипеда с вращающимися спицами колеса (стробоскопический эффект). Поэтому, при дискретизации телевизионного сигнала с граничной частотой 6 МГц, необходимо, чтобы fд > 12 … 14 Мгц.

Квантование (преобразование по амплитуде) представляет собой замену величины отсчета сигнала ближайшим значением из набора фиксированных величин - уровней квантования. Следовательно, квантование - это округление величины отсчета. Уровни квантования делят весь диапазон возможного изменения значений сигнала на конечное число интервалов - шагов квантования. Обычно при квантовании производится пре­д­ставление абсолютного значения решетчатой функции Uс [T] Umn в двоичном виде. Функция преобразования при ква­нтовании описывается зависимостью:

Umn (N) 2N Umn

где Umn = Uc min - разрешающая способность АЦП, соответствующая минимальному уровню видеосигнала (уровню белого), N - разрядность АЦП.

Таким образом, в результате кодирования полный видеосигнал преобразуется в трехмерную дискретную функцию изображения - (UYUV)mn:

(UYUV)mn = U(N, m, n, UY,UU,UV, t).

Здесь (UYUV)mn - дискретная амплитуда пикселя, расположенного на пересечении m-ой строки и n-ого столбца.

Искажения сигнала, возникающие в процессе квантования, называют шумом квантования. Обычно, при оценке шума вычисляют разность между исходным сигналом Uс и его квантованным значением Uс(N), а в качестве показателей шума принимают среднеквадратичное значение этой разности. Особенностью шума квантования является его связь непосредственно с сигналом, поэтому его нельзя устранить последующей фильтрацией. Шум квантования убывает с уве­личением числа уровней квантования N. Нормой считается N = 10, что при двоичном кодировании позволяет квантовать видеосигнал на 1024 уровня. (Для монохромного изображения эти уровни называются градациями яркости). Таким образом, в результате проведенных преобразований видеосигнал представляет собой последовательность кодовых слов, каждое из которых передается в пределах одного интервала дискретизации.

Способы квантования и дискретизации ви­део­сиг­нала в СТЗ в значительной степени определяют ее эксплуатационные характеристики - быстродействие и разрешающую спо­соб­ность.

Быстродействие СТЗ, как правило, задается числом обрабатываемых изображений в секунду и зависит от размера и типа изображения и числа градаций яркости. Оно связано со временем ввода и временем обработки данных процессором СТЗ. Как уже отмечалось, работа с массивами изображений требует очень высокой пропускной способности канала передачи данных. Так, только ввод 10 полутоновых кадров размером 512512 элементов при 256 градациях яркости за секунду, требует пропуск­ной способности интер­фейса 2,6 Мбайт/с. Цифровой же поток при чересстрочном вводе такого же цветного изображения с двухбайтовой глубиной цвета составит 512512252 13 Мбайт/c.

Режим реального времени требует обработки одного поля изображения в темпе кадровой развертки, т.е. за 1/50 с, или 20 мс. Обычно, для улучшения качества изображений (с учетом эргономических требований) необходимо обеспечить большие значения частот кадровой развертки - 85 … 120 Гц. С этой целью устройства ввода и вывода изображений оснащаются гра­фическими процессорами. Так, например, при 24 битовом представлении изображения в «естественных цветах» с разрешением 1024768 и вертикальной разверткой 85 Гц скорость передачи данных составляет более 200 Мбайт/с. Такая производительность превышает возможности стандартных локальных компьютерных шин. Частота строчной развертки устройства вывода изображений (например, монитора) должна составлять не менее 76885 = 66 кГц.

Основными путями решения проблемы реального времени при вводе и выводе изображений являются:

  • разработка новых типов локальных шин (подобных тем, которые установлены на графических станциях);

  • создание специализированного быстродейст­вующего программного обеспечения.

Так, стандарт локальной шины AGP (Acceler­ated Graphics Port) обеспечивает пропускную способность шины канала - 533 Мбайт/с (по сравнению с 132 Мбайт/с для шины PCI), причем именно с такой скоростью смогут обмениваться данными процессор, видеоадаптер и оперативная память.

Разрешающая способность СТЗ оценивается двояко: по полю (пространственное разрешение) и амплитуде. Первая характеризует размер пикселя изображения и определя­ется частотой дискретизации устройства ввода (рис. 6.34). Чем тоньше деталь, тем выше соответствующая ей частота видеосигнала. Разрешение по элементам изображения ограничивается «муар-эф­фек­том», заметным у всех устройств ввода и вывода (особенно у мониторов и сканеров). Он является проявлением интерференции волн и оп­ределяется критерием Най­квиста. «Муар-эф­фек­т» воз­никает, когда размер фрагмента изображения соответствует порогу разрешения.

Для телекамер на основе ПЗС и ФДМ разрешение по полю соответствует количеству элементов матрицы. Чем больше элементов разложения содержит матрица, тем выше разрешение системы в целом. Например, ФДМ свойственно невысокое пространственное разрешение 104 (100100) элемен­тов (для СТЗ Insight 32, Англия или Hitachi Zosen Corp., Япония). Что касается ПЗС-камер, оно достигает (2 … 3) 106 элементов и выше. При описании пространственного разрешения устройств используются разные единицы измерения. Так, в телевидении разрешающая способность измеряется в линиях (твл) на единицу длины, причем учитываются и белые и черные линии - твл/мм, в оптике учитываются только черные линии, а в вычислительной технике разрешение характеризуется количест­вом точек на дюйм (dpi). Следовательно, разрешение в 300 dpi соответствует 300 черным точкам на 1 дюйме, или 150 полосам на дюйме. Для устранения этого разночтения при определении разрешающей способности устройства используют тестовые таблицы и процедуры.

При выборе разрешения по амплитуде (уровней квантования видеосигнала) учитывают особенности зрения. Так, на основании физиологических исследований установлено, что человек не способен различить 2% изменения градаций серого тона. Другими словами, глаз распознает не более 64 уровней серого, что позволяет для качественной оцифровки полутонового изображения использовать 6-ти разрядный АЦП. Однако здесь есть два момента. Во-первых, для любого АЦП характерно наличие шума, уровень которого примерно соответствует его младшему разряду. Во-вторых, чувствительность глаза обладает логарифмической характеристикой, что позволяет ему различать в нижней части диапазона яркостей больше оттенков, чем в верхней. Технические устройства (сканеры и мониторы) имеют линейную характеристику, и поэтому для обеспечения необходимого разрешения малых яркостей требуется при дискретизации не менее 8 бит. В профессиональ­ных системах применяются 10-ти и более разрядные АЦП.

Как уже отмечалось, спектральная чувствительность глаза во всем диапазоне видимого света неодинакова. Она максимальна в области желто-зеленых тонов - примерно такая же, как и для серого цвета. Красные и синие тона различаются гораздо хуже. Обычно поступают просто - для каждой цветовой составляющей выбирают разрешение равное 1 байт, что и образует известную величину 16,8 миллионов цветов (256256256). Такое количество цветов намного превышает возможности человеческих глаз. Большинство людей различает приблизительно 128 цветовых тонов при 30 значениях насыщенности и 50 уровнях яркости. Это соответствует максимум 1283050 = 192000 цветам. Данный режим также получил название True Co­­lor, в отличие от упрощенного цветового режима с разрешением в 5 бит на цветовую составляющую и названного High Co­lor (32768 цветов).

6.4.1. Принципы хранения изображений

Запись больших объемов видеоинформации осуществляется на носитель, в качестве которого чаще всего используется магнитная лента шириной 8, 12,7 или 25 мм. Принцип магнитной записи был предложен и впервые осуществлен датским инженером В. Поульсеном в 1898 г. Он основан на способности определенных материалов, приобретать остаточную намагниченность в результате воздействия магнитного поля. Чаще всего это поле создается универсальной магнитной головкой, непосредственно взаимодействующей с носителем и записывающей, воспроизводящей или стирающей видеоинформацию. Магнитная головка представляет собой сердечник из магнитомягкого материала с нанесенной на него обмоткой. Материал сердечника (пермаллой, феррит и др.) характеризуется высокой магнитной проницаемостью и низкой коэрцитивной силой. Сердечник содержит зазор, ширина которого составляет 0,1 … 10 мкм. При записи в обмотку магнитной головки подают ток записываемого сигнала Ic, который намагничивает сердечник и возбуждает в области зазора магнитное поле рассеяния. Поле пронизывает носитель, движущийся через область зазора и намагничивающий его в соответствии с сигналом. Принцип считывания информации (воспроизведения) мало отличается от ее записи. Как известно, зависимость остаточной намагниченности носителя от напряженности поля H нелинейна. Для ее линеаризации в магнитную головку наряду с током сигнала Ic подается ток подмагничивания Iп, частотой в 4 …6 и амплитудой в 6 … 8 раз выше наибольшей частоты сигнала. В этом случае зависимость становится практически линейной до значений Iп = (0,3 … 0,4) Iнас, где Iнас - ток записи, соответствующей магнитному насыщению носителя.

Различают аналоговую и цифровую запись изображений. При аналоговой записи, сигналы записываются на дорожки продольно, поперечно и перпендикулярно направлению движения ленты (рис. 6.35). В первом случае, разноименные магнитные полюса участков расположены на одной и той же стороне рабоче­го слоя (рис. 6.35а). Поперечный вид записи реализуется путем формирования строчек остаточной намагниченности на ленте подвижными магнитными головками, переме­щающимися перпендикулярно ей с большой скоростью (рис. 6.35б). При этом строчки записи уже не оказываются строго поперечными, а имеют некоторый наклон в сторону движения ленты. Разновидностью поперечного вида записи является наклонно-строчный (диагональ­ный) вид, когда магнитные дорожки располагаются под острым углом к направлению движения ленты. Этот вид записи, появившийся в 60-х годах ХХ века получил особое распространение при записи телевизионных сигналов. Его существенной особенностью явилась возможность записи на одной строке носителя целого телевизионного поля. (Для сравнения: при поперечной записи на одной строке можно было записать всего 15 … 20 твл).

Одной из основных проблем, возникающих при записи видеоизображений, является необходимость передачи широкополосного видеосигнала без искажений. Как известно, при стандарте 625 строк в кад­ре и передаче 25 кадр/с полоса частот видеосигнала располагается в пределах 0 … 6 МГц. Минимальная длина волны , которую удается записать в совре­менной промышленной аппаратуре магнитной за­писи, лежит в пределах 0,3 … 2 мкм. Следовательно, для записи сигнала с частотой fmax = 6 МГц при дли­не волны, например, 2 мкм необходима отно­сительная скорость носителя и головки vотн = fmax 12 м/с. Такая весьма высокая относительная скорость достигается, главным образом, за счет быстрого вращения магнитных головок, а также использования нескольких магнитных головок (2 … 4), поскольку значительных скоростей протяжки vл магнитной ленты достичь очень сложно. Обычно, vл 40 см/с. Однако, и при таких скоростях движения носителя, возникают аэродинамические эффекты, существенно ухудшающие качество записи и воспроизведения. Поэтому, вместо непосредственной записи изображения на носитель, используют метод ЧМ, при которой видеосигнал модулирует некоторую несущую частоту fн = (1,1 … 1,5) fmax. Спектр записываемых частот в этом случае переносится в более высокочастотную область, уменьшая, тем самым, наибольшую длину записываемых волн . Недостатком такого подхода является расширение необходимой полосы частот, которая для видеосигнала (0 … 6 МГц) увеличилась до 0,5 … 11 МГц.

В современных системах записи vотн = 25 м/с. Это означает, что система «носитель-головка» должна пропускать полосу частот от fmin = 0,5 МГц до fmax = 11 МГц, которая соответствует полосе длин волн от min = 25 м/с : 0,5 МГц = 50 мкм до max = 25 м/с : 11 МГц = 2,3 мкм. При записи цветных видеоизображений сигнал цветности выделяется из полного композитного видеосигнала фильтром высоких частот. Далее, он модулирует поднесущую частоту из диапазона 550 … 800 кГц и записывается на носитель совместно с яркостным сигналом, несущая которого fн > 8,2 МГц. Сигнал яркости также выполняет высокочастотное подмагничивание сигнала цветности.

Качество изображения, воспро­изводимое повременными аналоговыми видеомагнитофонами, настолько высоко, что при их правильной настройке и выборе соответствующей видеоленты, изобра­жения объекта, передаваемые не­посредственно с видеокамеры и с видеомагнитофона визуально неотличимы. Важнейшим недостатком аналоговых систем записи является ограничение на многократное копирование видеоинформации. Уровень шума каждый раз возрастает на 1,5 … 3 дБ. Поэтому, в последнее время широкое применение получила цифровая запись видеоизображений. Цифровая видеозапись требует значительного расширения пропускной способности канала записи по сравнению с ана­логовой. Так, для известного цифрового формата магнитной видеозаписи D1 с раздельным кодированием сигналов яркости и цветности 4 : 2 : 2 при частоте дискретизации сигнала яркости 13,5 МГц, а сигналов цветности R-Y и B-Y 6,75 МГц и 8 битовом квантовании амплитуды поток информации составит (13,5 + 2 6,75) МГц 8 бит = 216 Мбит/с. Цифровой композитный сигнал требует существенно меньшей пропускной способности канала. Например, при записи в формате D2 при частоте дискретизации сигнала, равной четвертой гармонике цветовой поднесущей (4 4,43 МГц), получим 4 4,43 МГц 8 бит = 142 Мбит/с. Заметим, что в обоих случаях полоса записываемых частот намного шире, чем при аналоговой записи.

Запись видеосигналов на магнитную пленку производится видеокамерами. Большинство из них в качестве датчика изображений используют ПЗС-матрицы разной размерности. Так, типовая матрица размером 0,5 дюйма содержит 400000 элемен­тов, разделенных на 581 строку и 756 столбцов. В последних моделях количество элементов превышает 106. В простых мобильных видеокамерах формируется композит­ный видеосигнал (он обы­чно присутствует на видеовыходе или разъеме SCART), в камерах среднего класса - компонентный. Телекамеры этих типов получили общее название camcorder (от англ. camera + recorder - записывающая камера). Тип выходного сигнала какордера зависит от формата записи - композитный, например, в VHS и SVHS камерах и компонентный - в камерах типа Betacam. Для профессиональных целей применяются цветные RGB-ка­меры, содержащие три ПЗС-матрицы, отдельно на каждую цветовую составляющую (рис. 6.36). На выходе RGB-ка­меры присутствуют как стандартный композитный видеосигнал, так и отдельно три цветовые составляющие. Следствием этого является возможность прямого подключения цветовых каналов, что улучшает качество вос­про­изведения.

Как уже отмечалось, телевизионный растр состоит из 625 (или 575 активных) строк разложения. Все видеокамеры обеспечивают получение такого разрешения по вертикали. Что же касается разрешения по горизонтали, то в идеале оно могло бы составить 6254/3 = 833, или, по крайней мере, 5754/3 = 767 элемента в строке. На самом деле это разрешение зависит от ширины полосы пропускания канала видеозаписи. Так, при передаче полной полосы частот видеосигнала в системе PAL (5 МГц) информация о яркости передается с разрешением 320 твл (перепадов яркости) в строке. Таким образом, при максимальном качестве аналоговое телевизионное изображение имеет раз­решение по горизонтали в 640 элементов. (Это соответствует, кстати, известному режиму VGA). Поэтому, разрешение черно-белого изображения составляет 575640 элемен­тов.

Однако реально ширина спектра записанного на магнитном носителе черно-белого изображения ограничена частотой 4 МГц, что соответствует 512 элементами в строке. Спектр записанного сигнала цветности не превышает 1,5 МГц, т.е. цветных элементов в строке допускается и того меньше 200 элементов. Лучшее качество изображения получают на основе ком­понентного принципа, когда сигналы цветности и яркости передаются и записываются на пленку раз­дельно. В таких устройствах можно записать аналоговый видеосигнал с полосой частот до 5 МГц, т.е. получить разрешение по горизонтали до 640 элементов в строке.

В табл. 6.13 представлены самые распространенные системы аналоговой магнитной записи.

Таблица 6.13. Основные принципы аналоговой магнитной записи изображений

Формат

VHS

Betacam

Характеристика

Бытовой

Hi-Fi

Тип сигнала

Композитный

Компонентный

Ширина спектра, МГц

4

5

Разрешение видео (реальное)

575512

575640

Разрешение телевизионное (PAL)

575767 (max 625833)


Проведем обзор основных форматов магнитной видеозаписи. Как уже отмечалось, низкочастотный телевизионный ви­деосигнал является композитным, т.е. представляет собой результат сложения яркостного сигнала Y, двух цветовых поднесущих, модулированных сигналами цветности U (R-Y или Cr) и V (B-Y или Cb), а также служебных импульсов, причем частоты цветоразностных сигналов лежат в пределах полосы спектра яркостного сигнала. Из-за строчной структуры телевизионного разложения в спектральной области все они имеют гребенчатую структуру, расстояния, между соответствующими пиками которых равны строчной частоте. При этом частоты поднесущих выбраны так, чтобы спектральные пики сигналов цветности оказались между пиками яркостного сигнала. В результате путем использования специальных гребенчатых фильтров возможно эффективное разделение этих сигналов. Однако, подобные фильтры весьма сложны и дороги, а потому в основном используются в профессиональной аппаратуре высокого разрешения. В бытовых аналоговых устройствах ограничиваются более простыми полосовыми фильтрами, заметно снижающими четкость изображений. Например, в видеомагнитофонах и камерах классов VHS (Video Home System) и Video-8, использующих только композитные видеосигналы, разрешение ограничено 240 твл. Кроме того, даже полное использование всех различий сигналов все равно не позволяет идеально разделить их. Поэтому более эффективным оказывается использование не единого композитного сигнала, а двух композитных сигналов Y и C. Y несет сигнал яркости и синхроимпульсы, а C (Chrominance) - модулированные цветовые сигналы. Такой комбинированный сигнал называется S-Video, он используется при записи/воспроизведении в аппаратуре классов S-VHS и Hi-8. Разрешение в этом случае достигает 400 твл. Следующим шагом к повышению качества явился переход к компонентному сигналу YUV. Он используется в профессиональной аппаратуре класса Betacam и обеспечивает разрешение до 500 твл. Наилучшее качество достигается в RGB устройствах: здесь отсутствуют кодирование и модуляция сигналов и достигается наиболее простая и точная передача сигнала. (Однако визуально достоинства этого формата практически неразличимы). В последние годы ХХ века было разработано несколько цифровых форматов представления видеосигнала. Аппаратура, работающая в этих форматах, выпускается фирмами Sony, Panasonic, JVC и др.

В табл. 6.14 представлен обзор распространенных форматов магнитной записи.

Таблица 6.14. Сравнительные характеристики форматов магнитной записи

Формат записи

Тип записи

Вид сигнала

Ширина ленты, мм

Скорость ленты, м/с

Отношение сигнал/шум, дБ

Коэффициент компрессии

VHS

Аналоговая

композитный

12,65

23,39

43

-

S-VHS

Аналоговая

Y/C

12,65

23,39

45

-

Hi8

Аналоговая

Y/C

8

20,5

44

-

Betacam

Аналоговая

YUV

12.65

101,5

49

-

Betacam SP

Аналоговая

YUV

12,65

101,5

51

-

Betacam SX

Цифровая

YUV 4:2:2

12,65

59,575

51

10:1

Digital Betacam

Цифровая

YUV 4:2:2

12,65

96,7

55

2:1

DV

Цифровая

YUV 4:2:0

6,35

18,831

54

5:1

DVCam

Цифровая

YUV 4:2:0

6,35

28,2

54

5:1

DVCPro

Цифровая

YUV 4:1:1

6,35

33,813

54

5:1

DVCPro50

Цифровая

YUV 4:2:2

6,35

67,626

62

3.3:1

Digital-S

Цифровая

YUV 4:2:2

12,65

57,8

55

3.3:1


Первыми цифровыми устройствами в телевидении стали цифровые корректоры временных искажений, кадровые синхронизаторы, генераторы специальных эффектов, микшеры и коммутаторы. Активный переход к цифровому телевидению произошел с появлением первого промышленного цифрового видеомагнитофона фирмы Sony. Во-первых, значительно улучшилось собственно качество воспроизводимого изображения и звука, во вторых, намного возросло количество допустимых перезаписей информации на носитель, практически без потери качества. К примеру, перезапись на видеомагнитофонах формата VHS, без допустимых для телевещания потерь качества не допускается вообще, формат S-VHS допускает одну-две перезаписи, а Betacam SP три-четыре. Для цифрового видеомагнитофона это число составляет несколько десятков. Однако цифровая запись изображений порождает ряд известных проблем, связанных со значительным расширением полосы частот, занимаемой сигналом. Так, если в студийном аналоговом видеомагнитофоне для передачи видеосигнала с частотой 6 МГц требуется записывать и воспроизводить полосу частот около 12 МГц, то в цифровом видеомагнитофоне для передачи такого же видеосигнала необходимо расширить полосу частот, по крайней мере, до 120 МГц. Другими словами, пропускная способность канала цифровой видеозаписи должна быть на порядок выше, чем аналоговой. Следовательно, и каналы связи должны иметь пропускную способность в несколько сотен мегабит в секунду. Техническое решение этой проблемы предполагает кодирование сигнала (т.е. его дискретизацию по времени, квантование по уровню и преобразование в одну из модуляционных форм), а также компрессию. Кодирование производится как композитного, так и компонентного видеосигналов.

6.4.2. Кодирование видеосигнала

Композитный сигнал в системах PAL и NTSC дискретизируется с частотой 4fц равной четвертой гармонике цветовой поднесущей. В системе NTSC строка содержит 910 элементов, из которых 768 образуют активную часть цифровой строки. В системе PAL на интервал аналоговой строки приходится нецелое число отсчетов с частотой 4fц, и, следовательно, длительность цифровой строки не равна длительности аналоговой. Все строки поля (за исключением двух) содержат по 1135 элементов, а две - по 1137. Скорость передачи цифровых данных в системе NTSC составляет 143 Мбит/с, а в системе PAL - 177 Мбит/с

Более распространенный в последнее время компонентный телевизионный видеосигнал на выходе телекамеры также имеет аналоговую фор­му. Для его представления в цифровом виде в соответствии с рекомендацией ITU-R 601устанавливаются правила раздельной дискретизации, квантования и кодирования сигнала яркости Y и двух цветоразностных сигналов R-Y (Cr