Thông tin về ReALM (Reference Resolution As Language Modeling) xuất hiện không lâu sau khi có thông tin tiết lộ rằng Apple có thể hợp tác với Google để tích hợp Gemini vào iOS 18 và tổ chức các cuộc đàm phán với OpenAI - công ty đã tạo ra ChatGPT. Ngoài ra, nhà sản xuất iPhone cũng đã mua lại hàng loạt startup liên quan đến ngành AI.
Các nhà phát triển ReALM cho biết mô hình AI này sẽ nhanh và hiệu quả hơn so với ChatGPT trong một số hoạt động. ReALM sẽ được trình bày chính thức tại hội nghị các nhà phát triển WWDC 2024 diễn ra vào tháng 6 với hứa hẹn có khả năng hiểu bối cảnh tham chiếu khác nhau của các yếu tố hình ảnh trên màn hình, chuyển đổi hình ảnh thành văn bản, tạo ra các tương tác đàm thoại và tự nhiên hơn với trợ lý giọng nói.
Nhóm nghiên cứu ReALM xác nhận AI này nhanh và hiệu quả hơn GPT-4 trong quá trình đồng hóa dữ liệu theo ngữ cảnh. Ngoài ra, họ muốn phổ biến một số nguyên tắc cơ bản trong việc phát triển mô hình ngôn ngữ của mình. Đại diện nhóm cho biết: “Có thể hiểu ngữ cảnh, bao gồm cả tài liệu tham khảo, là điều cần thiết đối với một trợ lý đàm thoại. Điều này cho phép người dùng đặt câu hỏi về những gì họ nhìn thấy trên màn hình, trở thành bước quan trọng để đảm bảo trải nghiệm rảnh tay trong trợ lý giọng nói”.
Được biết, máy tính không thể giải thích hình ảnh giống như cách con người có thể làm được, tuy nhiên Apple đã tìm ra giải pháp với ReALM với khả năng tái cấu trúc toàn bộ bối cảnh của màn hình thành văn bản. Mô hình này hứa hẹn cho hiệu suất tương tự GPT-4 bằng cách sử dụng ít tham số hơn, nhưng hiệu quả hơn nhờ việc tăng các thông số của nó.
“Chúng tôi đã chứng minh những cải tiến lớn so với hệ thống hiện có với chức năng tương tự trên nhiều loại tài liệu tham khảo khác nhau, trong đó mô hình nhỏ của chúng tôi đạt được mức cải thiện 5% về số tài liệu tham khảo trên màn hình. Các mô hình lớn hơn hoạt động tốt hơn đáng kể so với GPT-4”, nhóm phát triển cho biết.
Mặc dù vậy, Apple vẫn còn rất nhiều việc phải làm phía trước do ReALM có những hạn chế khi quản lý các tài liệu tham khảo trực quan phức tạp hơn khi cần phân biệt giữa nhiều hình ảnh. Với kết quả ban đầu, ReALM sẽ rất hứa hẹn và có thể khiến Siri cũng như các thành phần khác trong hệ điều hành của Apple có thể mang lại những lợi ích to lớn cho người dùng.
Tác giả bài viết: Văn Kiến
Nguồn tin: thanhnien.vn:
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Công bố kèm theo Quyết định này thủ tục hành chính nội bộ trong hệ thống hành chính nhà nước thuộc phạm vi chức năng quản lý của UBND tỉnh Sơn La bao gồm các lĩnh vực: Lĩnh vực nội vụ: Thủ tục Bổ nhiệm vào ngạch công chức đối với người hoàn thành chế độ tập sự; thủ tục Thẩm...