Last Updated on 11/07/2024 by rromruns
AMD เปิดตัว AMD OLMo ตัวโมเดล large language models (LLMs) AI 1B-parameter open-source ใหม่ตัวแรก
ตั้งเป้าสำหรับใช้งานหลากหลายและสำหรับใช้ฝึกระบบกับเครื่องที่ใช้ชิป GPU Instinct MI250 ซึ่งบอกอีกด้วยว่าจะเป็นตัว LLM ที่มีความสามารถในการใช้เหตุและผล การปฏิบัติตามคำแนะนำ และการสนทนาที่เป็นธรรมชาติ
LLMs open-source ตัวนี้ก็จะช่วยให้ AMD สามารถยกระดับองค์กรในอุตสาหกรรม AI ขึ้นมาให้สูงขึ้น และยังช่วยให้ลูกค้าหรือใครก็ตามสามารถที่จะเอา LLMs ตัวนี้ไปใช้งานกับอุปกรณ์ AMD ของตัวเองได้
นอกเหนือจากการเอาไปใช้งานกับ data center แล้ว AMD ก็ยังจะนำเอาโมเดล OLMo ตัวนี้มาใช้งานกับเครื่อง AI PC ที่ใช้ชิป AMD Ryzen ที่มีชิประมวลผล neural processing units (NPUs) ด้วย สำหรับพัฒนาโมเดล AI สำหรับเครื่องคอมพิวเตอร์ส่วนบุคคล
โมเดล OLMo นี้ได้รับการฝึกระบบด้วยข้อมูลขนาดใหญ่ถึง 1.3 ล้านล้านโทเคน บน 16 โหนด แต่ละโหนดมีชิป AMD Instinct MI250 จำนวน 4 ตัว (รวมตัวประมวลผลทั้งหมด 64 ตัว)
ผลการทดสอบประสิทธิภาพจาก AMD ก็ออกมาค่อนข้างน่าประทับใจทีเดียว เมื่อเทียบกันกับตัวอื่น ๆ ในตลาดอย่าง TinyLlama-1.1B, MobiLlama-1B และ OpenELM-1_1B
ที่มา ibit.ly/ehTW8