GPT-4o mini – Mô hình hiệu quả và tiết kiệm chi phí

0
121
GPT-4o mini – Mô hình hiệu quả và tiết kiệm chi phí
Từ ngày 18/7/2024, Trên trang chat.openai.com và các app liên quan của OpenAI chính thức khai trừ mô hình ChatGPT 3.5.
Với mô hình GPT-4o mini này, người dùng có thể import image và text thay chỉ mỗi text với phiên bản 3.5. Đây là 1 bước cải tiến đáng kể của OpenAI đối với người sử dụng.

GPT-4o mini là gì ?

GPT-4o mini là một phiên bản thu nhỏ của mô hình ngôn ngữ lớn GPT-4o. Mô hình được thiết kế để hoạt động hiệu quả trên như điện thoại thông minh hoặc máy tính bảng,..v… với khả năng xử lý ngôn ngữ tương tự như GPT-4o nhưng ở quy mô nhỏ hơn.

Ngoài ra, mô hình này được tối ưu lại rõ rệt về mặt chi phí khi người dùng gọi API.

Mô hình nhỏ và khả năng lý luật vượt trội

  • GPT-4o mini vượt qua GPT-3.5 Turbo và các mô hình nhỏ khác trên các tiêu chuẩn học thuật về trí tuệ văn bản và lý luận đa phương tiện, và hỗ trợ cùng phạm vi ngôn ngữ như GPT-4o.
  • Mô cũng thể hiện hiệu suất mạnh mẽ trong việc gọi hàm, cho phép các nhà phát triển xây dựng ứng dụng lấy dữ liệu hoặc thực hiện hành động với các hệ thống bên ngoài, và cải thiện hiệu suất trong ngữ cảnh dài so với GPT-3.5 Turbo.

Nguồn: https://help.openai.com/en/articles/7102672-how-can-i-access-gpt-4-gpt-4-turbo-gpt-4o-and-gpt-4o-mini

GPT-4o mini đã được đánh giá qua nhiều tiêu chuẩn quan trọng.

  • Nhiệm vụ lý luận: GPT-4o mini tốt hơn các mô hình nhỏ khác ở các nhiệm vụ lý luận liên quan đến cả văn bản và hình ảnh, đạt 82.0% trên MMLU, một tiêu chuẩn về trí tuệ văn bản và lý luận, so với 77.9% của Gemini Flash và 73.8% của Claude Haiku.
  • Khả năng toán học và lập trình: GPT-4o mini xuất sắc trong các nhiệm vụ lý luận toán học và lập trình, vượt trội hơn các mô hình nhỏ trước đó trên thị trường. Trên MGSM, đo lường lý luận toán học, GPT-4o mini đạt 87.0%, so với 75.5% của Gemini Flash và 71.7% của Claude Haiku. GPT-4o mini đạt 87.2% trên HumanEval, đo lường hiệu suất lập trình, so với 71.5% của Gemini Flash và 75.9% của Claude Haiku.
  • Lý luận đa phương tiện: GPT-4o mini cũng cho thấy hiệu suất mạnh mẽ trên MMMU, một tiêu chuẩn đánh giá lý luận đa phương tiện, đạt 59.4% so với 56.1% của Gemini Flash và 50.2% của Claude Haiku.
GPT-4o mini đã được đánh giá qua nhiều tiêu chuẩn quan trọng.

Biện pháp an toàn tích hợp

  • An toàn được tích hợp vào GPT-4o mini từ giai đoạn đầu và được củng cố qua từng bước phát triển. Mô hình lọc bỏ thông tin không mong muốn và sử dụng học tăng cường với phản hồi từ con người để cải thiện độ tin cậy.
  • GPT-4o mini có các biện pháp an toàn tương tự như GPT-4o và được kiểm tra bởi hơn 70 chuyên gia. Mô hình áp dụng phương pháp phân cấp chỉ thị mới để tăng cường khả năng chống lại các cuộc tấn công và đảm bảo an toàn khi sử dụng quy mô lớn. Chúng tôi sẽ tiếp tục theo dõi và cải thiện an toàn của mô hình.

Khả năng truy cập và giá

  • GPT-4o mini hiện có sẵn dưới dạng mô hình văn bản và hình ảnh trong Assistants API, Chat Completions API, và Batch API. Các nhà phát triển sẽ trả 15 xu cho mỗi triệu token đầu vào và 60 xu cho mỗi triệu token đầu ra (khoảng 2500 trang sách tiêu chuẩn). Chúng tôi dự định sẽ triển khai tính năng tinh chỉnh cho GPT-4o mini trong những ngày tới.
  • Trong ChatGPT, người dùng Free, Plus và Team sẽ có thể truy cập GPT-4o mini ngay từ hôm nay, thay thế cho GPT-3.5. Người dùng Enterprise cũng sẽ có quyền truy cập bắt đầu từ tuần tới, nhằm thực hiện sứ mệnh làm cho lợi ích của AI có sẵn cho tất cả mọi người.

So sánh mô hình: GPT-4o, GPT-4o mini, GPT-4, GPT-3.5

Mô hình Mô tả Độ dài ngữ cảnh Loại đầu vào/đầu ra
GPT-4o Là mô hình thông minh nhất, nhanh nhất và mới nhất. 128k (tương đương tiểu thuyết dài) Văn bản và hình ảnh/Văn bản và hình ảnh *
GPT-4o mini Là mô hình thông minh nhẹ nhất. 128k (tương đương tiểu thuyết dài) Văn bản và hình ảnh/Văn bản và hình ảnh *
GPT-4 Là mô hình thông minh cao trước đây. 128k (tương đương tiểu thuyết dài) Văn bản và hình ảnh/Văn bản và hình ảnh *
GPT-3.5 Là mô hình nhanh cho các nhiệm vụ thường ngày đơn giản. 16k (tương đương 1-2 chục bài báo hoặc truyện ngắn/truyện dài kỳ) Văn bản/Văn bản

LEAVE A REPLY

Please enter your comment!
Please enter your name here