Microsoft ได้วางตำแหน่ง Phi-4 ให้เป็นผู้นำในการแก้ปัญหาทาง matic โดยอ้างถึงประสิทธิภาพที่เพิ่มขึ้นอย่างมากจากทั้งรุ่นก่อนและรุ่นที่เทียบเคียงได้ บริษัท dent เกี่ยวกับความสามารถของโมเดล AI หลังจากที่ Phi-4 รายงานว่าได้รับคะแนนสูงสุดในเกณฑ์มาตรฐานต่างๆ
ที่มา: ไมโครซอฟต์
ในการทดสอบ GPQA ได้คะแนน 56.1 ซึ่งเหนือกว่า GPT-4o ที่ 40.9 และ 49.1 ของ Llama-3 จากเกณฑ์มาตรฐาน MATH นั้น Phi-4 ทำได้ 80.4 ซึ่งสะท้อนถึงความสามารถขั้นสูงในการแก้ปัญหาอัล matic ที่ซับซ้อน นอกจากนี้ยังเป็นเลิศในด้านเกณฑ์มาตรฐานการเข้ารหัส โดยได้คะแนน 82.6 ใน HumanEval
นอกจากนี้ Phi-4 ยังแสดงให้เห็นถึงความกล้าหาญในสถานการณ์ในโลกแห่งความเป็นจริง รวมถึงคะแนนสูงในด้านปัญหาจาก Mathe matic al Association of America's American Mathe matic s Competitions (AMC-10/12) ผลลัพธ์เหล่านี้บ่งชี้ถึงการประยุกต์ใช้ที่เป็นไปได้ในการวิจัยทางวิทยาศาสตร์ วิศวกรรม และการสร้างแบบจำลองทางการเงิน ในสาขาที่ความถูกต้องแม่นยำทาง matic และการให้เหตุผลเป็นสิ่งสำคัญ
ที่มา: ไมโครซอฟต์
แม้ว่าโมเดลขนาดใหญ่ เช่น GPT-4o ของ OpenAI และ Gemini Ultra ของ Google จะทำงานด้วยพารามิเตอร์นับแสนล้านหรือหลายล้านล้านรายการ แต่ Phi-4 ก็แสดงให้เห็นว่าสถาปัตยกรรมที่มีขนาดเล็กลงและมีประสิทธิภาพสามารถบรรลุประสิทธิภาพที่เหนือกว่าในงานเฉพาะทางได้
Microsoft ให้เครดิตความก้าวหน้าของ Phi-4 ในการบูรณาการข้อมูลสังเคราะห์คุณภาพสูงควบคู่ไปกับชุดข้อมูลของเนื้อหาที่มนุษย์สร้างขึ้น รวมถึงการปรับปรุงที่ไม่เปิดเผยในระหว่างหลังการฝึกอบรม ความพยายามเหล่านี้สะท้อนให้เห็นถึงแนวโน้มที่กว้างขึ้นใน อุตสาหกรรม AI ซึ่งทีมวิจัยมุ่งเน้นไปที่นวัตกรรมในการใช้ข้อมูลสังเคราะห์และการเพิ่มประสิทธิภาพหลังการฝึกอบรมมากขึ้น
Alexandr Wang CEO ของ Scale AI เน้นย้ำถึงการเปลี่ยนแปลงนี้เมื่อเร็ว ๆ นี้ โดยตั้งข้อสังเกตว่าอุตสาหกรรมได้เข้าสู่ "กำแพงข้อมูลก่อนการฝึกอบรม" และเสริมว่าตอนนี้บริษัทต่างๆ จะแข่งขันกันเพื่อพัฒนาโมเดล AI ที่มีประสิทธิภาพมากขึ้น
การประมวลผลมีความสำคัญ แต่ข้อมูลก็มีความสำคัญเช่นกัน และเราได้มาถึงกำแพงข้อมูลก่อนการฝึกอบรมแล้ว
— อเล็กซานเดอร์ หวัง (@alexandr_wang) 12 ธันวาคม 2024
เตรียมพร้อมรับข้อมูลหลังการฝึกอบรมที่เพิ่มมากขึ้น บริษัทต่างๆ จะแข่งขันกันเพื่อให้ได้ข้อมูลที่ดีที่สุด ไม่ว่าจะเป็นหลายรูปแบบ ตัวแทน การให้เหตุผลที่ซับซ้อน และอื่นๆ อีกมากมาย
ติดตามข้อมูลค้นหาผู้ชนะ
7/8