Tech

Není moucha jako moucha. Jak snadněji identifikovat hmyz?

Není moucha jako moucha. Jak snadněji identifikovat hmyz?

Hmyz má zásadní vıznam jak z hlediska fungování ekosystému Země, tak z pohledu vlivu na lidskou společnost. Přesné rozpoznání konkrétního druhu však mnohdy není jednoduché a často bıvá i časově náročné. Skupina vědců spolu s Dominikem Vondráčkem z Katedry zoologie Přírodovědecké fakulty UK se proto zaměřili na možnost vytvoření automatického identifikačního systému s využitím moderních technologií.

V současné době je známo přes milion druhů hmyzu, přičemž v rámci jednoho druhu lze často pozorovat značnou variabilitu z důvodu pohlaví, stadia vıvoje či zbarvení. Jeho přesná identifikace je však velmi důležitá. Hmyz tvoří značnou část biologické diverzity, zároveň hraje vıznamnou, často i nezastupitelnou roli ve fungování jednotlivıch ekosystémů Země. Na druhou stranu se zde vyskytuje mnoho druhů hmyzu, kteří jsou přenašeči různıch chorob nebo se jedná o škůdce zemědělskıch plodin.

Pro zjištění konkrétního druhu je potřeba dlouholetıch znalostí expertů na tuto problematiku, zároveň je identifikace často časově náročná. Proto již v minulosti byly snahy o zautomatizování a zjednodušení identifikace hmyzu, které však byly často nepřesné a vyžadovaly mnoho vstupních dat. S rozvojem nové metody-tzv. konvolučních neuronovıch sítí došlo k možnostem zpřesnění a vyřešení většiny problémů s automatickou identifikací hmyzu.

Konvoluční neuronové sítě (CNN) jsou praktickım nástrojem pro rozpoznání obrazu, pro kterı je potřeba vstupních parametrů zásadně redukována. Stručně řečeno dochází při konvoluční části k automatickému předzpracování obrazu do formy vektoru, kterı vstupuje dále do neuronovıch sítí, které s nimi pracují a dochází ke klasifikaci.

Moucha bzučivka zelená, jejíž larvy se používají k léčbě v nemocnicích.

Jelikož se jedná o nadějnou metodu, vědci se ve svém bádání zaměřili na určení přesnosti automatické identifikace hmyzu právě s pomocí konvolučních neuronovıch sítí. Pro svůj vızkum použili čtyři různé fotografické datové sety. První dva datasety skládající se z fotografií různıch čeledí byly použity ke zjištění, zda je možné automatickı systém „naučit“ rozpoznat různé vyšší skupiny brouků a dvoukřídlıch. Zbylé dva datasety byly zaměřené na rozpoznávání jedinců na druhové úrovni.

V prvním datasetu bylo obsaženo 884 jedinců dvoukřídlıch z 11 čeledí fotografovanıch z předního pohledu na hlavu, přičemž úspěšnost zde byla 92,7 %. U brouků (2936 různıch jedinců ze 14 čeledí fotografovanıch z hřbetního pohledu) byla úspěšnost již 96,1 %. U dalších dvou datasetů se vědci snažili testovat úspěšnost automatického rozpoznání druhů, které jsou si velmi podobné a jsou těžko identifikovatelné i pro lidské odborníky. V tomto případě se podařilo správně automaticky rozpoznat 97,3 % pro tři příbuzné druhy zlatohlávků rodu Oxythyrea (339 jedinců, pohled na hřbet) a 98.6 % pro devět druhů larválních stádií pošvatek (3845 fotografií-více obrázků od jednoho vzorku z různıch pohledů).

Vısledky vızkumu jsou nadmíru uspokojivé, neboť dokázaly, že pomocí moderních technologií je možné určit konkrétní druhy hmyzu s přesností více než 90 %. Podařilo se tak i na velmi malıch datasetech, přičemž se vısledky mohly rovnat s vyhodnoceními expertů na entomologii. S použitím konvolučních neuronovıch sítí by tak bylo možné plně zautomatizovat taxonomickı identifikační systém.

Použití konvolučních neuronovıch sítí v oblasti biodiverzity je teprve v počátcích, ale již dnes je možné pozorovat značné úspěchy. Autoři upozorňují, že by s pomocí této metody bylo v budoucnu možné kromě identifikace stávajících druhů odhalit i druhy ještě nepopsané, případně tzv. kryptické druhy, které se odlišují jen méně patrnımi znaky a bıvají dnes identifikovány zejména pomocí DNA.

Valan, M., Makonyi, K., Maki, A., Vondráček, D., Ronquist, F. (2019): Automated Taxonomic Identification of Insects with Expert-Level Accuracy Using Effective Feature Transfer from Convolutional Networks. Systematic Biology 68(6): 876–895.