OpenAI ogłosiło znaczące ulepszenie możliwości generowania obrazów przez ChatGPT. Nowa funkcja, oparta na modelu GPT-4o, oferuje bardziej szczegółowe i precyzyjne obrazy oraz zaawansowane opcje edycji.
Co zmienia GPT-4o w generowaniu obrazów?
Podczas wtorkowej transmisji na żywo Sam Altman, CEO OpenAI, zapowiedział pierwszą od ponad roku dużą aktualizację funkcji generowania obrazów przez ChatGPT. Nowa wersja, wspierana przez model GPT-4o, umożliwia użytkownikom zarówno tworzenie, jak i edycję obrazów oraz zdjęć.
Model GPT-4o, który wcześniej służył wyłącznie do generowania tekstu, teraz pozwala na:
- Tworzenie szczegółowych obrazów – nowy algorytm generuje bardziej realistyczne i precyzyjne grafiki.
- Edycję obrazów – użytkownicy mogą modyfikować istniejące zdjęcia, w tym z udziałem osób, oraz zmieniać detale, takie jak obiekty na pierwszym planie czy w tle.
Nowa funkcja jest dostępna od dziś dla użytkowników Pro w ramach abonamentu za 200 dolarów miesięcznie. OpenAI zapowiedziało również, że wkrótce zostanie udostępniona dla subskrybentów planu Plus oraz użytkowników darmowych.
Jak działa GPT-4o z obrazami?
Model GPT-4o wykorzystuje dane publicznie dostępne oraz te pochodzące ze współpracy z firmami, takimi jak Shutterstock. OpenAI zapewnia, że przestrzega praw autorskich, wprowadzając mechanizmy zapobiegające generowaniu obrazów bezpośrednio naśladujących prace żyjących artystów.
Brad Lightcap, COO OpenAI, podkreślił w rozmowie z Wall Street Journal, że firma oferuje twórcom możliwość wycofania ich prac z bazy treningowej modelu za pomocą specjalnego formularza. Ponadto OpenAI szanuje żądania zablokowania swoich botów indeksujących przed zbieraniem danych z określonych stron internetowych.
ChatGPT kontra konkurencja
Wprowadzenie GPT-4o do generowania obrazów to odpowiedź na konkurencyjne rozwiązania, takie jak eksperymentalna funkcja Google Gemini 2.0 Flash. Mimo dużej popularności, rozwiązanie Google wzbudziło kontrowersje z powodu braku odpowiednich zabezpieczeń, co umożliwiało m.in. usuwanie znaków wodnych i tworzenie obrazów z postaciami chronionymi prawami autorskimi.
OpenAI stawia na większą kontrolę i przestrzeganie zasad etycznych, co może uczynić ich rozwiązanie bardziej atrakcyjnym dla użytkowników dbających o legalność i jakość generowanych treści.
Nowa era generowania obrazów?
Rozszerzenie możliwości ChatGPT o zaawansowaną generację obrazów to ważny krok dla OpenAI. Dzięki funkcjom edycji i realistycznym efektom model GPT-4o otwiera nowe możliwości dla twórców treści i użytkowników indywidualnych, jednocześnie zapewniając większą przejrzystość i respektowanie praw autorskich.