More

    NotebookLlama od Meta – otwarte narzędzie do generowania podcastów z tekstu

    Meta udostępniła NotebookLlama – alternatywę open source dla popularnego narzędzia Google’a, NotebookLM, które pozwala miedzy innymi generować podcasty na podstawie tekstów. Oparte na modelach Llama, NotebookLlama przetwarza teksty z plików PDF, tworząc konwersacyjne podsumowania w stylu podcastów. Choć efekt jest bardziej „sztuczny” niż w przypadku narzędzia Google, Meta stawia na otwartość i możliwość dalszego rozwoju przez społeczność deweloperską.

    Jak działa NotebookLlama?

    NotebookLlama, podobnie jak NotebookLM, jest w stanie wygenerować streszczenie w formie podcastu, przechodząc przez kilka etapów przetwarzania tekstu:

    1. Przetwarzanie pliku PDF – wykorzystując model Llama-3.2-1B-Instruct, NotebookLlama usuwa niepotrzebne znaki i przygotowuje czysty tekst do dalszego przetworzenia.
    2. Pisanie transkrypcji – model Llama-3.1-70B-Instruct (lub opcjonalnie Llama-3.1-8B-Instruct) tworzy przyjazną w odbiorze transkrypcję, nadając jej charakter konwersacyjny.
    3. Adaptacja – w celu uatrakcyjnienia treści model Llama-3.1-8B-Instruct dodaje do tekstu odrobinę „dramaturgii“, nadając podcastowi bardziej emocjonalny charakter.
    4. Konwersja tekstu na mowę – na koniec proces używa modeli Parler-TTS Mini V1 oraz Bark’s Suno, aby zamienić tekst w realistyczne audio.

    Rozwój technologii podcastów

    NotebookLlama otwiera nowe możliwości dla deweloperów i entuzjastów sztucznej inteligencji, którzy mogą testować i modyfikować kod w ramach GitHub. Choć jakość audio generowanego przez NotebookLlama pozostawia jeszcze pole do poprawy, Meta liczy na to, że z czasem projekt zyska na naturalności dzięki udoskonaleniu modeli text-to-speech. Zgodnie z zapowiedziami, NotebookLlama ma także potencjał do rozwijania nowych funkcji, takich jak debaty między agentami AI na wybrany temat.

    Podobnie jak inne systemy AI, NotebookLlama boryka się z problemem halucynacji, czyli generowania nieprawdziwych informacji. Z tego powodu, choć projekt Meta oferuje ciekawą alternatywę dla Google’a, użytkownicy muszą pamiętać, że treści w tych generowanych podcastach mogą zawierać błędy lub nieścisłości.

    Meta i globalny sukces modeli Llama

    Llama od Meta to nie tylko narzędzie, które może być przydatne dla twórców podcastów. Modele te zdobyły globalną popularność, osiągając 400 milionów pobrań. Meta intensywnie inwestuje w rozwój swoich modeli AI, z planem wprowadzenia Llama 4 w przyszłym roku. Zdaniem Marka Zuckerberga to moment podobny do „Linuxa dla AI”, a topowi liderzy branży, wierzą że Llama jest jednym z fundamentów przyszłości sztucznej inteligencji, zwłaszcza na rynkach takich jak Indie.

    Nowe