Używanie głębokiego uczenia czy sieci neuronowych do rozpoznawania obrazu nie ma sensu – twierdzi Artur Majtczak

Artur Majtczak jest programistą, autorem i pomysłodawcą m.in. popularnego odtwarzacza ALLPlayer oraz sztucznej inteligencji Sara AI, która w odróżnieniu od asystentów głosowych takich jak Siri czy Asystent Google’a, nie tylko odpowiada na pytania, ale – jak zapewnia jej twórca – także je rozumie.

Zdaniem Majtczaka, by rozpoznawać odręcznie napisane cyfry lub obraz, wystarczy jedna lub maksimum kilka – a nie, jak dziś powszechnie się uważa, dziesiątki tysięcy – próbek. Na dodatek wielkość próbki wykorzystywanej do uczenia systemu czy badania jego skuteczności nie ma znaczenia – tak jak bez znaczenia są inne tradycyjnie stosowane w tej materii kryteria: wyśrodkowanie, wielkość, kąt obrotu czy grubość linii tekstu.

Dla wykazania słuszności swych tez Artur Majtczak odwołuje się do pisma odręcznego z tzw. zbioru znaków MNIST. To składający się z 70 tysięcy obrazów zbiór, skompletowany przez Yanna LeCuna. Ten współczesny guru w dziedzinie informatyki i widzenia maszynowego traktuje zbiór jak bazę danych dla osób, które chcą wypróbować techniki uczenia się i metody rozpoznawania wzorców na rzeczywistych danych.

„Używanie sieci neuronowych do rozpoznawania cyfr to jak zastąpienie patyka służącego do pisania cyfr na piasku na plaży wyspecjalizowanym robotem wybierającym z plaży po jednym ziarnku piasku w celu otrzymania tego samego wzoru!” – pisze Artur Majtczak.

Pełny tekst artykułu Artura Majtczaka na ten temat publikujemy TUTAJ.