Apple เปิดตัวโมเดลภาษาขนาดใหญ่ (LLM – Large Language Model) แบบโอเพ่นซอร์ส ที่ออกแบบมาให้สามารถทำงานบนอุปกรณ์ โดยไม่ต้องผ่านเซิร์ฟเวอร์คลาวด์ เรียกว่า OpenELM (Open-source Efficient Language Models)

OpenELM มีทั้งหมด 8 โมเดล โดย 4 โมเดลแรก ได้รับการฝึกอบรมล่วงหน้าโดยใช้ไลบรารี CoreNet และที่เหลือเป็นโมเดลที่ปรับคำสั่ง ซึ่งใช้กลยุทธ์การปรับขนาดแบบเลเยอร์ เพื่อปรับปรุงความแม่นยำและประสิทธิภาพ
Apple กล่าวว่า OpenELM เป็นโมเดล AI แบบโอเพ่นซอร์สที่ล้ำสมัย เพื่อเสริมศักยภาพและเสริมสร้างชุมชนการวิจัย การแบ่งปันโมเดลโอเพ่นซอร์สทำให้นักวิจัยมีวิธีตรวจสอบความเสี่ยง ข้อมูล และอคติของโมเดล นักพัฒนา และบริษัทสามารถใช้แบบจำลองตามที่เป็นอยู่หรือทำการปรับเปลี่ยนได้
การแบ่งปันข้อมูลอย่างเปิดเผย กลายเป็นเครื่องมือสำคัญสำหรับ Apple ในการรับสมัครวิศวกร นักวิทยาศาสตร์ และผู้เชี่ยวชาญชั้นนำ เนื่องจากเป็นโอกาสสำหรับงานวิจัยที่ปกติแล้วไม่สามารถเผยแพร่ได้ภายใต้นโยบายลับของ Apple
ทั้งนี้ Apple ถูกอ้างว่ามีแผนนำความสามารถของ AI มาสู่อุปกรณ์ครั้งแรกใน iOS 18 และมีข่าวลือว่าจะใช้ LLM เพื่อวัตถุประสงค์ด้านความเป็นส่วนตัวในอุปกรณ์
ที่มา – MacRumors






