Машинное зрение

Машинное (техническое, компьютерное) зрение — один из наиболее перспективных методов автоматизации действий с применением компьютерных технологий и робототехники. В самом общем виде системы машинного зрения подразумевают преобразование данных, поступающих с устройств захвата изображения, с выполнением дальнейших операций на основе этих данных. В настоящее время машинное зрение наиболее востребовано в медицине и биотехнологиях, военной отрасли, автомобильной промышленности. Во всяком случае, в этих областях уже есть четко сформулированные задачи для машинного зрения, решением которых занимаются ведущие исследовательские центры и робототехнические компании. При этом возможное поле применения  машинного зрения, по-настоящему, огромно — эти технологии могут быть использованы практически во всех сферах жизнедеятельности.

В частности, в медицине обработка полученных при помощи компьютерного зрения изображений и видеоданных может применяться для более точной постановки диагнозов, а в промышленности использование машинного зрения позволяет значительно снизить себестоимость продукции за счет частичного или полного отказа от выполнения ручных операций, таким образом, сводя к минимуму воздействие «человеческого фактора».

Система машинного зрения включает следующие основные компоненты:

  • подсистему формирования изображений;
  • вычислительную систему;
  • алгоритмы анализа изображений.

Развитие машинного зрения интенсивно идет по всем трем перечисленным компонентам. Однако, в условиях, когда качественные устройства захвата изображений становятся вполне доступными для их не только промышленного или военного использования, но и бытового, а вычислительные мощности позволяют совершать миллиарды операций в секунду, давая тем самым возможность их использования в системах реального времени, критичным становится построение эффективных алгоритмов для анализа получаемых изображений.

Одной из наиболее сложных задач в машинном зрении при применении его в робототехнике является распознавание, включающее в себя обнаружение и идентификацию объектов. В частности, решение этой задачи позволяют выполнить оценку положения объекта относительно устройства захвата изображения.

Перспективным направлением развития машинного зрения является получение и дальнейшая обработка данных с использованием пассивных устройств захвата изображения, к которым относится камера. В отличие от применения различных датчиков, такой метод вплотную приближает работу системы машинного зрения (особенно, при использовании стереозрения) к той, что использует человек для решения зрительных задач. Другими словами, на входе и робототехническая система, и человек получают одну и ту же зрительную информацию. Разнятся только алгоритмизация и вычислительные мощности, которые используются для ее преобразования и интерпретации. Но и в этом направлении уже сделаны весомые шаги, дающие решать различные задачи в самом общем виде.

Такой подход позволяет эффективно внедрять робототехнические системы, использующие машинное зрение, непосредственно в обычную для человека среду. А это дает возможность расширить сферы применения машинного зрения, выводя их далеко за рамки жестко детерминированных сред в промышленности и постепенно захватывая все новые области его использования в быту.

Именно на таком направлении развития машинного зрения, основанном на использовании камер, специализируется наша компания. Среди наших партнеров, в сотрудничестве с которыми мы ведем наши разработки, — компании из области медицины, создания беспилотных летательных аппаратов и другие.

Один из первых успешных опытов, показывающих возможности машинного зрения, был продемонстрирован нами еще в 2001 году. Тогда, совместно с немецкой компанией Neuropower, на основе стандартной модели конструктора Lego и простой веб-камеры мы сделали робота, собирающего из девяти случайным образом разбросанных по столу кубиков логотип компании. Комплекс демонстрировался на международной выставке в Вене, а мы были приглашены для участия в передаче Computer Club на западногерманском канале WDR.

 

 

Пожалуй, наиболее ярко преимущества использования камер для машинного зрения проявились в ходе нашего участия в конкурсе летающих роботов, проводимом компанией КРОК в 2013 году. В задачу входили взлет со стартового маркера, автономный пролет по лабиринту с препятствиями, возвращение и посадка на точку взлета. В рамках конкурса решить эту задачу удалось только одному роботу из 536 заявленных — нашему. При этом нами сознательно были исключены различные датчики, сонары и лидары, и использована только камера. Как именно проходил полет нашего робота, можно увидеть на представленном ниже видео, а подробнее прочесть о нашем техническом решении в нашем блоге: http://robodem.com/blog/kak-my-uleteli-i-s-trudom-vernulis-podrobnyy-otchet-o-nashem-uchastii-v-sorevnovaniyah