KomputilojInformadiko

Moderna komputilo vizion. Taskoj kaj komputila vizio teknologio. Programado Computer Vision en Python

Kiel instrui komputilo kompreni kion estas prezentita en la bildo aŭ bildoj? Ŝajnas simpla, sed por komputila tio decas matrico konsistas de nuloj kaj de kiu vi volas ekstrakti gravaj informoj.

Kio estas komputila vizio? Estas la kapablo "vidi" via komputilo

Vidado - estas grava fonto de informoj por la persono uzi ĝin, ni ricevi, laŭ diversaj taksoj, de 70 ĝis 90% de la tuta informo. Kaj, kompreneble, se ni volas krei inteligenta aŭto, ni bezonas por efektivigi la saman kapablojn kaj komputilo.

La problemo de komputilaj vizio povas esti komencita tute klare. Kio estas "vidi"? Ĝi komprenas ke kie estas nur rigardas. Tio finis la diferencoj de komputila vizio kaj homa vizio. Vizion por ni - ĝi estas fonto de scio pri la mondo, same kiel fonto de metrikaj informo - tio estas, la kapablo kompreni la distancoj kaj grandecoj.

Semantika kerno bildo

Rigardante la foton, ni povas priskribi ĝin per kelkaj atributoj, por tiel diri, por ekstrakti semantika informo.

Ekzemple, rigardante tiun foton, ni povas diri ke estas al la libera aero. Kio estas la urbo trafikon. Ke estas aŭtoj. ni povas konjekti, ke tio estas Sudorienta Azio de la agordo de la konstruaĵo kaj hieroglifoj. La portreto de Mao Zedong kompreni, ke tio estas Pekino, kaj se iu vidis video en vivas aŭ mem estis tie, konjektus, ke tiu estas la fama Placo Tiananmen.

Kion ni povas diri pli pri la bildo, vidante ĝin? Ni povas identigi objektoj en la bildo, kiu diras, ke ekzistas homoj ĉi tie pli proksima - barilo. Jen pluvombrelo, ke konstruaĵa afiŝojn. Ĉi tiuj estas ekzemploj de klasoj estas tre grava objektoj, kiuj okupiĝas pri serĉado de la momento.

Ankoraŭ ni povas lerni kelkajn eblecojn aŭ atributoj de objektoj. Ekzemple, ĉi tie ni povas determini ke tio ne portreto de ordinaraj ĉinoj, nome, Mao Zedong.

Laŭ la veturilo povas determini ke ĝi estas kortuŝa objekto, kaj ĝi estas malfacila, tio ne estas misformita dum la movado. Pri flagoj povas diri ke objektoj, ili ankaŭ estas movanta, sed ili ne estas malfacila, konstante deformitaj. Kaj en la sceno estas la vento, kiu povas esti difinita per evoluantaj flagoj, kaj povas eĉ difini la direkton de la vento, ekzemple, ĝi blovas de maldekstre dekstren.

La distancoj kaj longaj en komputila vizio

Tre grava estas la metriko informoj pri komputila vizio scienco. Jen ĉiajn distancoj. Ekzemple, por la rover estas precipe grava ĉar la teamoj estas el la Tero ĉirkaŭ 20 minutoj kaj respondi tiel. Laŭe, la ligilo tie kaj reen - 40 minutoj. Se ni faras planon por movado komandojn de la Tero, vi devas preni ĉi konsideri.

Sukcese integrita la teknologio de komputilaj vizion en la videoludoj. Laŭ la video, vi povas konstrui tridimensiaj modeloj de objektoj, homoj, kaj fotoj de la uzanto povas restarigi la tridimensiaj modeloj de urboj. Kaj poste marŝi sur ili.

komputila vizio - iom larĝa gamo. Ĝi estas proksime interplektita kun diversaj aliaj sciencoj. Parto de komputila vizio Ĝi kaptas la foto-rivelado areon kaj foje allocates komputila vizio, historie.

Analizo, mastro rekono - la vojon al la kreo de supera inteligenteco

Ni rigardu tiuj konceptoj aparte.

Image Processing - tio estas areo de algoritmoj, en kiu la enigo kaj eligo - bildo, kaj ni havas lin fari ion.

bildo analizo - estas la areo de komputila vizio, kiu centras en laboranta kun la dudimensia bildo kaj fari konkludojn el tio.

Skemo Rekono - abstrakta matematika disciplino kiu rekonas datumoj en la formo de vektoroj. Tio estas, al la pordo - vektoro kaj ni havas ion por fari kun ĝi. Kie la vektoro estas, ni ne estas tiel grava scii.

Komputila vizio - ĝi originale iris redoni la strukturo de la dudimensiaj bildoj. Hodiaŭ tiu areo iĝis pli larĝa kaj ĝi povas esti interpretita kiel akcepto de ĉiuj fizikaj objektoj farante, surbaze de la bildo. Tio estas, ĝi estas la tasko de artefarita inteligenteco.

Paralele al komputila vizio en tute alia kampo, en geodezio, fotogrametría evoluis - mezuro de la distanco inter objektoj sur dudimensia bildoj.

Robotoj povas "vidi"

Kaj fine - jen maŝino vizion. Sub la maŝino vizio signifas vizion de robotoj. Tio estas la decido de iuj problemoj de produktado. Ni povas diri ke komputilo vizion - estas unu granda scienco. Ĝi kombinas iuj de la aliaj sciencoj parton. Kaj la komputila vizio ricevas neniun apartan aplikon, ĝi igas maŝino vizion.

Komputila vizio regiono havas mason de praktikaj aplikoj. Ĝi estas rilata al la aŭtomatigo de produktado. Ĉe la entreprenoj fariĝis pli efika por anstataŭigi manlaboro per maŝino. La maŝino ne ricevas laca, ne dormas, ŝi havis malregula laboro horaro, ŝi pretas labori 365 tagoj jare. Do, uzante la maŝino laboro, ni povas akiri garantiita rezulto en momento donita, kaj ĝi estas tre interesa. Ĉiuj taskoj havi klaran uzon por komputila vizio sistemoj. Kaj ekzistas nenio pli bona ol vidi la rezultojn tuj en la bildo nur en la ŝtono scenejo.

Sur la sojlo de la mondo de artefarita inteligenteco

Plus la areo - estas malfacile! Signifa parto de la respondeca cerbo de vizio, kaj ĝi kredas ke se vi instruas via komputilo al "vidi", tio estas, la plena uzo komputila vizio, estas unu el la celoj de plena artefarita inteligenteco. Se ni povas solvi la problemon de la homa nivelo, plej verŝajne samtempe, ni solvos la problemon de AI. Tio estas tre bona! Aŭ ne estas tre bona, se vi rigardas, "Terminator 2".

Kial vizion - estas malfacile? Ĉar la bildo de la sama objekto povas varii ege depende de eksteraj faktoroj. Depende de la celo de observado punktoj aspektas malsamaj.

Ekzemple, unu kaj la sama figuro, prenitaj de malsamaj anguloj. Kaj kio estas plej interesa en la figuro povas esti unu okulo, du okulojn kaj duono. Kaj depende de la kunteksto (se ĉi tiu bildo de homo en ĉemizo kun pentritaj okuloj), la okulo povas esti pli ol du.

La komputilo ankoraŭ ne komprenas, sed "vidas"

Alia faktoro kiu faras malfacila - estas la lumigado. La sama sceno kun malsamaj lumigado aspektos malsamaj. objekto grandeco povas varii. Cetere, la celoj de iu ajn klaso. Kiel vi povas diri pri viro, ke lia alteco de 2 metroj? Nenion. Homaj kresko kaj povas esti 2.3 m kaj 80 cm. Kiel kun aliaj tipoj de objektoj, tamen, estas objektoj de la sama klaso.

Aparte vivantaj objektoj sperti diversajn trostreĉojn. Haro homoj, atletoj, bestoj. Rigardu bildojn de ĉevaloj kurante, determini kio okazas kun sia kolhararo kaj vosto estas simple neebla. Al interkovrantaj objektoj en bildo? Se baton komputila bildo, eĉ la plej potenca maŝino trovi malfacilaĵojn por doni la ĝustan decidon.

Sekva vido - estas maskovesto. Kelkaj objektoj, bestoj maskanta kiel la medio, kaj tute lerte. Kaj la sama makuloj kaj kolorigo. Tamen, ni vidas ilin, kvankam ne ĉiam de malproksime.

Alia problemo - la movado. Objektoj en moviĝo neimagebla suferi deformación.

Multaj el la celoj estas tre ŝanĝiĝema. Ĉi tie, ekzemple, en la du fotoj sub la celoj de la "seĝo".

Kaj en ĉi vi povas sidi. Sed instrui maŝino, kiel ekzemple ke la malsamaj aferoj en formo, koloro, materialo, ĉio estas objekto "seĝo" - estas tre malfacila. Jen la defio. Integri metodoj de komputila vizio - estas instrui maŝino kompreni, analizi, spekuli.

Integriĝo de komputilo vizion en diversaj platformoj

La maso de komputila vizio komencis penetri pli en 2001, kiam li kreis la unuan vizaĝon detektilo. Ni faris ĝin du aŭtoroj: Viola, Jones. Ĝi estis la unua rapida kaj fidinda sufiĉa algoritmo, kiu montris la potencon de maŝino lernado metodoj.

Nun komputila vizio havas sufiĉe nova praktikaj aplikoj - rekono de la homa vizaĝo.

Sed rekoni la homon kiel en la filmoj - hazarde anguloj, malsamaj lumigado kondiĉoj - estas neeble. Sed por solvi la problemon, aŭ unu kiu estas malsamaj homoj kun malsamaj lumigado aŭ en malsama pozo, simila kiel en la foto en la pasporto, eblas kun alta grado de konfido.

pasporto foto postuloj plejparte pro la trajto de la vizaĝo rekono algoritmoj.

Ekzemple, se vi havas biométricos pasporto, en iuj modernaj flughavenoj, vi povas uzi la aŭtomatan pasporto kontrolsistemo.

Nesolvita problemo de komputila vizio - la kapablon rekoni ajnan tekston

Eble iu uzis OCR sistemo. Unu el ili - a Belaj Reader, estas tre populara en RuNet sistemo. Estas multaj formoj kie vi entajpu la datumoj, ili estas perfekte escaneados, la informo estas rekonita de la sistemo tre bone. Sed kun iu ajn teksto en la bildo la situacio estas multe pli malbona. Tiu problemo ankoraŭ restas nesolvita.

Ludoj engaĝante komputila vizio, preno de movado

Apartigu granda spaco - estas la kreo de tridimensiaj modeloj kaj preno de movado (kiu estas tute sukcese implementado en komputilaj ludoj). La unua programo, kiu uzas komputilon vizion - sistemo de interago kun la komputilo uzante gestoj. Kiam estis kreita estis multon malfermita.

La algoritmo estas desegnita tute simple, sed agordi ĝin prenis por krei generatoro de sintezaj bildoj de homoj akiri milionon bildoj. Supercomputadora kun ili elekti la parametrojn de la algoritmo, por kiu li nun laboras ankaŭ.

Tio milionon bildojn kaj semajno numerebla supercomputadora tempo eblas krei algoritmon kiu konsumas 12% de la kapablo de unu procesoron kaj permesas al persono perceptas la pozicio en reala tempo. Ĉi Microsoft Kinect sistemo (2010).

Serĉi bildojn de enhavo permesas alŝuti fotojn al la sistemo, kaj la rezultoj de ĝi donos ĉiujn bildojn kun la sama enhavo kaj farita el la sama angulo.

Ekzemploj de komputilaj vizion: tridimensia kaj dudimensiaj mapoj nun estas farita kun ĝi. Mapoj por navigado aŭtoj estas regule ĝisdatigita laŭ la DVR.

Estas datumbazo kun miliardoj da geotageitajn fotojn. Elŝutante la foton en la datumbazo, vi povas determini kie ĝi estis farita, kaj eĉ kun iom da perspektivo. Kompreneble, kondiĉe ke la loko estas populara sufiĉa ke iam la turistoj kaj faris kelkajn fotojn de la areo estis tie.

robotoj estas ĉie

Robotiko en la nuna tempo, ĉie, sen ĝi iel. Ekzistas veturiloj kiuj havas specialajn ĉambrojn kiuj rekonas piedirantoj kaj vojo signojn por transdoni komandojn al la ŝoforo (tiu laŭ maniero komputila programo por rigardi, helpas la motorciklisto). Kaj estas plene aŭtomata robota veturiloj, sed ili ne povas dependi nur de la ĉambro de vídeo sistemo sen la uzo de granda kvanto de aldona informo.

Moderna fotilo - ĉi tiu estas analogo fotilo obscura

Ni parolu pri la cifereca bildo. Modernaj ciferecaj ĉambroj estas aranĝitaj laŭ la principo de la ĉambro obscura. Nur anstataŭ la truo tra kiu la lumo eniras la trabo kaj projektita sur la malantaŭa muro de la ĉambro de la temo cirkviton, ni havas specialan optikan sistemon nomita la lenso. Lia celo estas kolekti grandan faskon de lumo kaj transformi ĝin por ke ĉiuj radioj trairis virtuala punkto por akiri la projekcio kaj formi bildon sur filmon aŭ matrico.

Modernaj ciferecaj ĉambroj (matrico) estas kunmetita de individuaj elementoj - rastrumeroj. Ĉiu pikselo povas mezuri la energion de la lumo kiu estas incidento sur la rastrumero entute, kaj emisii unu produktado nombro. Tial, en cifereca fotilo, ni preni anstataŭ la bildo brilo aro lumo mezuradojn, kaptita en sola pixel - la komputilo vida kampo. Sekve, kiam la bildo ni vidas ne estas fluanta linioj kaj klaraj konturoj, kaj krado de koloraj kvadratoj en malsamaj koloroj - rastrumeroj.

Sube vi vidas la unuan ciferecan bildon de la mondo.

Sed en ĉi tiu bildo estas ne? Koloro. Kio estas koloro?

Psikologia percepto de koloro

Koloro - tio estas, kion ni vidas. La koloro de la unu kaj la sama afero por homoj kaj katoj estos malsamaj. Ĉar ni (homoj) kaj besto optikan sistemon - la vizio estas malsama. Sekve, la koloro - estas psikologia kvalito de nia vizio kiu okazas al la observi objektojn kaj lumo. Kaj ne estas fizika propraĵo de la objekto kaj la lumo. Koloro - estas la rezulto de la interago de lumo komponantojn, kaj la sceno de nia vida sistemo.

Programado Computer Vision en Python uzante bibliotekoj

Se vi decidis engaĝi serioze en la studo de komputila vizio, devus tuj preparos dum kelkaj malfacilaĵoj, tiu scienco ne estas la plej facila kaj kaŝas kelkajn kaptiloj. Sed "Programado Computer Vision en Python" la autoría de Jan Erik Solema - libro kiu skizas la tutan plej simpla lingvo. Ĉi tie vi konatiĝi kun la metodoj de rekono de diversaj objektoj en 3D, lerni labori kun la stereofonia bildo, virtuala realaĵo kaj multaj aliaj aplikoj de komputila vizio. En la libro estas sufiĉe ekzemploj en Python. Sed la klarigoj estas prezentitaj, por tiel diri, komunigita, por ne superŝarĝi tro da esplorado kaj malfacila datumo. Laboru taŭga por studentoj, amatoroj, kaj entuziasmuloj. Elŝutu ĉi tiu libro kaj aliaj pri komputila vizio (pdf-formato) povas esti en la reto.

Nuntempe, ekzistas malfermita fonto biblioteko de komputila vizio algoritmoj kaj prilaboro de bildoj kaj nombra algoritmoj OpenCV. Ĝi estas realigeblaj plej modernaj programlingvoj, estas malfermita fonto. Se ni parolas pri komputila vizio, Python uzas kiel programlingvo, ĝi ankaŭ havas la apogon de la biblioteko, krome, ĝi estas konstante evoluanta kaj havas grandan komunumon.

La kompanio "Microsoft" provizas liaj servoj Api-povis trejni la neŭra reto labori ĝin kun bildoj de homoj. Estas ankaŭ la eblecon apliki komputila vizio, Python uzas kiel programlingvo.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 eo.delachieve.com. Theme powered by WordPress.