
จีนเดินหน้าผลักดันเทคโนโลยีด้านปัญญาประดิษฐ์อย่างต่อเนื่อง โดยล่าสุด Wei Shaojun รองประธานสมาคมเซมิคอนดักเตอร์จีน (CSIA) และศาสตราจารย์มหาวิทยาลัย Tsinghua ได้นำเสนอ “แนวคิด” AI Accelerator ที่ออกแบบภายในประเทศ โดยใช้การผสานชิป logic 14nm เข้ากับ DRAM 18nm ผ่านเทคนิค Hybrid Bonding ซึ่งเป็นรูปแบบการเชื่อมต่อแบบแนวดิ่งความละเอียดสูง เพื่อเพิ่มประสิทธิภาพจนสามารถ “เข้าใกล้ NVIDIA Blackwell” ที่ใช้เทคโนโลยีระดับ 4nm ได้ แม้กระบวนการผลิตของจีนจะเก่ากว่าหลายรุ่นก็ตาม
Wei ย้ำชัดว่าแนวคิดนี้ยังไม่ถูกสร้างเป็นฮาร์ดแวร์จริงและยังไม่มีข้อมูลยืนยัน แต่สะท้อนความต้องการของจีนที่อยากสร้าง โซลูชัน AI ที่ควบคุมได้เองทั้งระบบ โดยไม่ต้องพึ่งพาเทคโนโลยีต่างประเทศ
Hybrid Bonding: โจทย์ใหม่ที่จีนหวังใช้ทดแทนช่องว่างด้านเทคโนโลยี
หัวใจสำคัญของแนวคิดนี้ไม่ใช่ความล้ำหน้าของเทคโนโลยีการผลิต แต่คือ “วิธีการประกอบชิป” แบบ Hybrid Bonding ซึ่งสามารถทำการเชื่อมต่อชั้นต่อชั้นด้วยความละเอียดระดับต่ำกว่า 10 ไมครอน ผ่านการเชื่อมทองแดงโดยตรง
ข้อดีหลักของ Hybrid Bonding คือ:
- ระยะสัญญาณสั้นมาก → ลด latency
- แบนด์วิดท์สูงขึ้นอย่างมาก
- ใช้พลังงานต่อบิตต่ำ
- เชื่อมต่อ logic–memory ได้แน่นกว่าการใช้ solder bumps แบบเดิมหลายเท่า
- เหมาะกับงานที่ต้องการ near-memory computing
แนวคิดนี้ทำให้จีนสามารถ “ชดเชย” การไม่มีเทคโนโลยีการผลิตขั้นสูง เช่น 4nm หรือ 3nm ได้บางส่วน ผ่านการเพิ่มประสิทธิภาพจากระดับแพ็กเกจ
ตัวอย่างที่ใกล้เคียงที่สุดคือ AMD 3D V-Cache ที่สามารถทำแบนด์วิดท์สูงสุดถึง 2.5 TB/s ด้วยพลังงานเพียง 0.05 pJ/bit ซึ่งมากกว่า HBM3E หลายเท่า และเป็นหนึ่งในเหตุผลที่ Wei เชื่อว่า Hybrid Bonding สามารถกลายเป็นตัวเร่งสำคัญให้จีนตามทันมหาอำนาจอย่างสหรัฐฯ
สเปกแบบจำลองที่ Wei เสนอ (ยังเป็นทฤษฎีทั้งหมด)
Wei ระบุว่า AI Accelerator แบบจีนที่ใช้ Hybrid Bonding จะให้ประสิทธิภาพระดับ:
- ราว 120 TFLOPS (ไม่ระบุ precision)
- ใช้พลังงานเพียง 60W
- Efficiency อยู่ที่ 2 TFLOPS/W
แต่เมื่อเทียบกับของจริง:
- NVIDIA B200: 10,000 NVFP4 TFLOPS / 1200W → 8.33 TFLOPS/W
- NVIDIA B300: สูงสุด 10.7 TFLOPS/W
แม้แนวคิดของจีนจะประหยัดพลังงาน แต่ระดับประสิทธิภาพยังห่างจาก Blackwell อยู่หลายเท่า และยังไม่มีการพิสูจน์ว่าสามารถสร้างฮาร์ดแวร์รูปแบบนี้ได้เป็นจริงในประเทศจีน
Near-Memory Computing — ทางเลือกใหม่ที่ช่วยลดคอขวดของ AI
Wei เชื่อว่าอนาคตของ AI จะถูกกำหนดโดย “ตำแหน่งของหน่วยความจำ” มากกว่า “ขนาด node ของ logic” โดยเฉพาะเมื่อโมเดล AI มีขนาดใหญ่ขึ้นเรื่อย ๆ ทำให้ Memory Bandwidth กลายเป็นคอขวดสำคัญ
Hybrid Bonding ช่วยแก้ปัญหานี้โดย:
- ทำให้ logic กับ DRAM อยู่ชิดกันมากที่สุด
- ลดระยะทางส่งข้อมูล
- เพิ่มอัตราการเข้าถึงข้อมูลต่อวินาที
- เหมาะกับงาน AI inference และ training แบบจำกัดพลังงาน
Wei ยังระบุว่าหากเทคโนโลยีนี้พัฒนาเต็มที่ อาจขยายสเกลสู่ระดับ ZetaFLOPS ได้ในระยะยาว แม้จะยังเป็นเพียงแนวคิดเชิงทฤษฎีเท่านั้น
อุปสรรคใหญ่ที่สุดไม่ใช่ฮาร์ดแวร์ แต่คือ CUDA ของ NVIDIA
Wei ยอมรับตรงไปตรงมาว่า แม้จีนจะสร้างชิปพลังสูงขึ้นได้จริง ก็ยังเจอปัญหาใหญ่คือ:
ระบบนิเวศ AI ทั่วโลกผูกติดกับ CUDA
- ไลบรารี
- เฟรมเวิร์ก
- โมเดล
- เครื่องมือพัฒนา
- ดาต้าเซ็นเตอร์
ทั้งหมดพึ่งพา CUDA แทบทั้งสิ้น ทำให้ฮาร์ดแวร์ที่ไม่ใช่ NVIDIA “แข่งขันได้ยากมาก” ไม่ว่าจะเป็น Huawei Ascend, Biren หรือแม้แต่โซลูชันแบบใหม่ของจีนเอง
Wei มองว่าจีนต้องสร้าง ecosystem ใหม่ขึ้นมาเอง และ Hybrid Bonding อาจเป็นแนวทางที่ทำให้จีนก้าวข้ามข้อจำกัดด้านซอฟต์แวร์ในระยะยาว
สรุปภาพรวม
แนวคิดของ Wei แม้ยังเป็นเพียงทฤษฎี แต่ชี้ให้เห็นอย่างชัดเจนว่า:
- จีนต้องการโซลูชัน AI ที่ควบคุมได้เองทุกด้าน
- Hybrid Bonding คือกุญแจสำคัญในการทดแทนการขาดแคลนเทคโนโลยีระดับ 4nm–3nm
- Near-memory computing จะเป็นแกนหลักของชิป AI ยุคถัดไป
- ผู้นำของตลาดอย่าง NVIDIA ยังคงได้เปรียบมหาศาลจาก ecosystem CUDA
- จีนจำเป็นต้องสร้าง ecosystem ของตัวเองเพื่อแข่งขัน
แม้ยังไม่มีฮาร์ดแวร์จริง แต่แนวคิดนี้สะท้อนความทะเยอทะยานของจีนในการพัฒนาชิป AI รุ่นใหม่ที่ไม่ต้องพึ่งพาต่างชาติในอนาคตนั้นเอง
ที่มา: tomshardware





