OpenAI vừa giới thiệu Sora, công cụ tích hợp trí tuệ nhân tạo (AI) cho phép người dùng có thể dễ dàng tạo nên những đoạn video từ văn bản mô tả.
Hiện tại, Sora chỉ có thể tạo video dài tối đa một phút với chất lượng hình ảnh có độ phân giải tốt đến 1080p và tuân thủ lời nhắc (prompt) của người dùng.
OpenAI cho biết, Sora có thể tạo ra những đoạn video với nội dung thực tế và giàu trí tưởng tượng dựa vào các văn bản hướng dẫn của người dùng. Các video do Sora tạo ra có thể bao gồm những khung cảnh phức tạp với sự góp mặt của nhiều nhân vật hoặc những khung cảnh giàu chi tiết, chính xác về bối cảnh xung quanh…
OpenAI cũng cho biết, họ đang dạy mô hình AI này hiểu và mô phỏng thế giới vật chất đang chuyển động, đào tạo các mô hình giúp con người giải quyết các vấn đề yêu cầu tương tác trong thế giới thực.
OpenAI khẳng định, Sora có sự hiểu biết sâu sắc về ngôn ngữ, cho phép diễn giải chính xác các lời nhắc và tạo ra các nhân vật hấp dẫn thể hiện cảm xúc sôi động. Sora cũng có thể tạo nhiều cảnh quay trong một video được tạo duy nhất để duy trì chính xác các ký tự và phong cách hình ảnh.
OpenAI cũng đã chia sẻ một số đoạn video được tạo ra bởi Sora, cho thấy khả năng tạo video ấn tượng của công cụ này. Tuy nhiên, nếu xem kỹ, chúng ta vẫn có thể nhận ra đây là những đoạn video được tạo ra bởi phần mềm AI, cho thấy OpenAI vẫn còn nhiều điều phải làm để giúp Sora trở nên hoàn thiện.
Sora chưa được cho đăng ký sử dụng rộng rãi mà chỉ dành cho một số chuyên gia thử nghiệm trước khi đưa Sora vào các sản phẩm của OpenAI.
OpenAI cũng đang xây dựng các công cụ giúp phát hiện nội dung sai lệch, chẳng hạn như công cụ cho biết thời điểm video được Sora tạo.
Trước đó, OpenAI cũng đã phát triển công cụ trí tuệ nhân tạo DALL-E 3, cho phép người dùng có thể tạo ra những bức tranh vẽ đẹp mắt và chi tiết bằng văn bản mô tả.