Istnieje wiele bardzo interesujących obszarów, z których biotechnologia, a zwłaszcza genetyka, nadal ewoluują w celu zapewnienia lepszej pomocy pacjentom. Przykładów można szukać od odkrywania leków, aż po wczesne diagnozowanie chorób (lub nawet predyspozycji do nich). W dzisiejszych czasach uczenie maszynowe i sztuczna inteligencja są często wykorzystywane do rozwiązywania takich problemów, ale rozwiązania takie są bardzo skomplikowane, a firmy podczas pracy nad takimi rozwiązaniami napotykają unikalne przeszkody związane również z ich własną dziedziną. Przeszkody te są głównie przypisywane dużej ilości danych, a także złożoności rozwoju ML, które ostatecznie powodują, że organizacje często mają trudności z rzeczywistym wprowadzeniem swoich modeli ML do produkcji ze względu na zawiłości związane z zarządzaniem danymi, modelami i ich skalowalnością.
Nasza firma, jako ekspert w dziedzinie MLOps, niedawno nawiązała współpracę z firmą genetyczną, aby pomóc im przezwyciężyć te wyzwania i przybliżyć ich rozwiązanie ML do realiów rynkowych, a uczynić je bliższym użytkownikowi końcowemu. Współpraca rozpoczęła się od kompleksowej analizy wymagań klienta, istniejącej infrastruktury, celów i ograniczeń technicznych — po czym zaprojektowaliśmy architekturę rozwiązań docelowych, którą również później wdrożyliśmy. Wdrożenie obejmowało różne elementy MLOps, które ostatecznie pozwalają na usprawnienie rozwoju ML, ale także spełnienie niektórych wymogów regulacyjnych (takich jak identyfikowalność danych). Komponenty te obejmowały wersjonowanie danych, śledzenie eksperymentów, zarządzanie procesami danych/przetwarzania i wiele innych. Wszystkie zostały wdrożone z wykorzystaniem również mnogich możliwości chmury — włączając paradygmat infrastruktury jako kod (IaC) oraz technologie agnostyczne w chmurze, takie jak Kubernetes, zapewniając klientowi możliwość bezproblemowego przełączania się między różnymi dostawcami chmury, jeśli to konieczne.
Projekt można uznać za sukces, ponieważ wdrożone komponenty MLOps znacznie pomagają wprowadzić strukturę i wydajność do zarządzania i przetwarzania danych, wprowadzając również cykl życia rozwoju ML, ułatwiając współpracę między naukowcami i inżynierami danych klienta. Ponadto wykorzystanie technologii chmurowych i infrastruktury jako kodu umożliwiło klientowi łatwe odtwarzanie środowiska w razie potrzeby i łatwe dostosowanie się do przyszłego rozwoju. W przyszłej współpracy, z niecierpliwością czekamy na kontynuowanie dostarczenia modeli przeszkolonych do obsługi ich użytkownikom końcowym w skalowalny i opłacalny sposób, pomagając w dostarczaniu innowacyjnych przypadków użycia biotechnologii do szerszego grona odbiorców.