Meta udostępniła NotebookLlama – alternatywę open source dla popularnego narzędzia Google’a, NotebookLM, które pozwala miedzy innymi generować podcasty na podstawie tekstów. Oparte na modelach Llama, NotebookLlama przetwarza teksty z plików PDF, tworząc konwersacyjne podsumowania w stylu podcastów. Choć efekt jest bardziej „sztuczny” niż w przypadku narzędzia Google, Meta stawia na otwartość i możliwość dalszego rozwoju przez społeczność deweloperską.
Jak działa NotebookLlama?
NotebookLlama, podobnie jak NotebookLM, jest w stanie wygenerować streszczenie w formie podcastu, przechodząc przez kilka etapów przetwarzania tekstu:
- Przetwarzanie pliku PDF – wykorzystując model Llama-3.2-1B-Instruct, NotebookLlama usuwa niepotrzebne znaki i przygotowuje czysty tekst do dalszego przetworzenia.
- Pisanie transkrypcji – model Llama-3.1-70B-Instruct (lub opcjonalnie Llama-3.1-8B-Instruct) tworzy przyjazną w odbiorze transkrypcję, nadając jej charakter konwersacyjny.
- Adaptacja – w celu uatrakcyjnienia treści model Llama-3.1-8B-Instruct dodaje do tekstu odrobinę „dramaturgii“, nadając podcastowi bardziej emocjonalny charakter.
- Konwersja tekstu na mowę – na koniec proces używa modeli Parler-TTS Mini V1 oraz Bark’s Suno, aby zamienić tekst w realistyczne audio.
Rozwój technologii podcastów
NotebookLlama otwiera nowe możliwości dla deweloperów i entuzjastów sztucznej inteligencji, którzy mogą testować i modyfikować kod w ramach GitHub. Choć jakość audio generowanego przez NotebookLlama pozostawia jeszcze pole do poprawy, Meta liczy na to, że z czasem projekt zyska na naturalności dzięki udoskonaleniu modeli text-to-speech. Zgodnie z zapowiedziami, NotebookLlama ma także potencjał do rozwijania nowych funkcji, takich jak debaty między agentami AI na wybrany temat.
Podobnie jak inne systemy AI, NotebookLlama boryka się z problemem halucynacji, czyli generowania nieprawdziwych informacji. Z tego powodu, choć projekt Meta oferuje ciekawą alternatywę dla Google’a, użytkownicy muszą pamiętać, że treści w tych generowanych podcastach mogą zawierać błędy lub nieścisłości.
Meta i globalny sukces modeli Llama
Llama od Meta to nie tylko narzędzie, które może być przydatne dla twórców podcastów. Modele te zdobyły globalną popularność, osiągając 400 milionów pobrań. Meta intensywnie inwestuje w rozwój swoich modeli AI, z planem wprowadzenia Llama 4 w przyszłym roku. Zdaniem Marka Zuckerberga to moment podobny do „Linuxa dla AI”, a topowi liderzy branży, wierzą że Llama jest jednym z fundamentów przyszłości sztucznej inteligencji, zwłaszcza na rynkach takich jak Indie.