Największym problemem dotyczącym uczenia maszynowego jest fakt, że na dziś jest ono wykorzystywane przez bardzo wąskie środowisko (akademickie, grupy badawcze w firmach). Nie ma zbyt wielu materiałów czy tutoriali, które byłyby łatwo zrozumiałe dla ludzi chcących „wybadać” temat, zrozumieć go, nie stając się przy tym ekspertami w dziedzinie.
Na platformie Coursera znajduje się bardzo ciekawy kurs dotyczący uczenia maszynowego. Jest darmowy, bardzo polecam zacząć właśnie do niego.
Po ściągnięciu i zainstalowaniu SciKit-Learn można też bawić się algorytmami uczenia maszynowego. To zbiór procedur napisanych w języku Python, które zawierają wersje „black box” niemal wszystkich standardowych algorytmów.
Google Colabolatory – uczenie maszynowe za darmo i dla każdego
Prosty model wytrenujemy nawet na laptopie, jednak gdy przychodzi do modeli poważniejszych, potrzebny jest specjalistyczny serwer obliczeniowy. I tu do gry wchodzi firma Google ze swoimi darmowymi serwerami w ramach projektu Colaboratory.
Platforma Google Colabolatory do trenowania systemów uczenia maszynowego udostępnia za darmo profesjonalne karty graficzne nVidia K80. Jak wszystko, co darmowe, to rozwiązanie także ma pewne ograniczenia. Proces uczenia jest przerywany co 12 godzin, a maszyna wirtualna, która udostępnia nam swoje zasoby, zostaje wyzerowana. Problem można rozwiązać, ale sposób jest nieco uciążliwy: należy zapisywać swoją pracę na bieżąco np. na Google Drive i w momencie gdy zajdzie taka potrzeba, wznawiać przerwane treningi.
Poniżej prezentuję prosty skrypt konfiguracyjny dla maszyny wirtualnej Colaboratory. Należy go uruchomić przed każdym uruchomieniem kolejnego nowego dema.