Sử dụng công nghệ machine learning, các nhà khoa học tại viện công nghệ Massachusetts ( MIT) đã tạo ra những đoạn video với chủ thể chuyển động hết sức tự nhiên chỉ từ những bức ảnh tỉnh.
ảnh minh họa
Đầu tiên, hệ thống được cho "học" những chủ đề video khác nhau như bãi biển, trẻ em, đá bóng,... sau đó từ những bức ảnh tĩnh, nó sẽ nhận xét bức ảnh đó nói tới cái gì và giả định ra những chuyển động mà trước đó nó đã thấy trong video do con người cho xem. Thí dụ như khi nhận diện ảnh là bãi biển, nó sẽ hiểu được phải có sóng biển, mấy em gái mặc bikini phải bơi hoặc bôi kem chống nắng,...
Tuy nhiên giống như những hệ thống tạo ra hình ảnh bằng AI trước đây, hệ thống của MIT vẫn có một số giới hạn. Đầu tiên chính là kích thước của video: hiện nó chỉ mới tạo ra được những đoạn video có chất lượng thấp, độ phân giải và chi tiết không cao. Thứ 2 chính là vấn đề độ dài: các đoạn video được tạo ra chỉ mới kéo dài có khoản 1 phút bởi về bản chất thì không có đủ thông tin hoặc "trí tưởng tượng" để nội suy thêm nội dung video.
Đồng thời, một giới hạn đáng chú ý nhất chính là tính thuyết phục của đoạn video. Phần lớn hiện tại đều không thật nếu chúng ta soi kỹ. Điển hình như trong đoạn video tạo ra từ hình ảnh đứa bé, các chuyển động vẫn còn rất kém và thậm chí gương mặt cũng bị méo mó, biến dạng. Nguyên nhân chính là do hệ thống machine learning chỉ mới có thể tạo ra được hình dạng của chuyển động chứ chưa thể tái tạo hoàn toàn chuyển động chính xác. Thêm một thí dụ nữa, trong những bức ảnh bãi biển, bạn sẽ thấy máy ước tính chuyển động của sóng đánh vào bãi biển, tuy nhiên, chỉ có một "con sóng nhỏ" lú ra khỏi những con sóng khác đánh vào bờ, khá vô lý.
Mặc dù còn rất nhiều điều cần phải hoàn thiện trước khi công nghệ này được hoàn thiện, tuy nhiên nhóm nghiên cứu tin rằng không chỉ có thể biến AI trở thành một "đạo diễn", tăng cường khả năng của công nghệ trí thông minh nhân tạo nói chung mà chính công nghệ biến ảnh thành video này còn có nhiều ứng dụng, thí dụ như trong điều tra vụ án,...