⚡ CyberClaw AI Base

🤖 Terminal Tự động hóa & Khám phá Kỷ nguyên AI

⚡ CyberClaw AI Base

🤖 Terminal Tự động hóa & Khám phá Kỷ nguyên AI

🤖 Trạm Tin AI

Hành trình khám phá phòng thí nghiệm chip Trainium của Amazon: Bộ não đằng sau các thương vụ với Anthropic, OpenAI và Apple

Reading Time: 3 minutes

Amazon Trainium Lab

Ngay sau khi CEO Amazon Andy Jassy công bố thỏa thuận đầu tư kỷ lục 50 tỷ USD của AWS vào OpenAI, Amazon đã mời phóng viên TechCrunch tham gia chuyến tham quan độc quyền phòng thí nghiệm phát triển chip tại Austin – trái tim của thỏa thuận này.

Điểm nhấn quan trọng:

  • Đầu tư khổng lồ: AWS cam kết cung cấp 2 gigawatt năng lượng tính toán chip Trainium cho OpenAI.
  • Hiệu quả chi phí: Chip Trainium3 có thể giảm tới 50% chi phí vận hành so với các máy chủ đám mây truyền thống.
  • Sức mạnh quy mô: Hơn 1 triệu chip Trainium2 đang vận hành mô hình Claude của Anthropic.
  • Thách thức Nvidia: Việc hỗ trợ PyTorch giúp các nhà phát triển chuyển đổi từ chip Nvidia sang Trainium chỉ với “một dòng code”.

Cuộc đua giành quyền tự chủ về phần cứng

Trong khi cả thế giới đang phải xếp hàng chờ đợi GPU của Nvidia, Amazon đã âm thầm xây dựng “vũ khí” riêng của mình. Đơn vị thiết kế chip tùy chỉnh của Amazon (tiền thân là Annapurna Labs) đã có hơn 10 năm kinh nghiệm. Từ chip Graviton tiết kiệm điện đến Inferentia chuyên dụng cho suy luận, và giờ đây là Trainium3 – con chip 3nm tiên tiến do TSMC sản xuất.

Sự hấp dẫn của AWS đối với các ông lớn như OpenAI và Anthropic không chỉ nằm ở giá thành. Hệ thống Trn3 UltraServer mới kết hợp với các bộ chuyển mạch Neuron cho phép mọi chip Trainium3 giao tiếp với nhau trong một cấu trúc lưới (mesh configuration), giúp giảm đáng kể độ trễ – một yếu tố sống còn khi xử lý hàng nghìn tỷ token mỗi ngày.

“Silicon Bring-up” và Văn hóa kỹ thuật tại Austin

Phòng thí nghiệm tại Austin không chỉ là nơi đặt các giá đỡ thiết bị. Đó là nơi diễn ra các buổi “tiệc đêm” mang tên “Silicon bring-up” – khoảnh khắc con chip lần đầu tiên được kích hoạt sau 18 tháng phát triển. Các kỹ sư Amazon kể lại rằng họ đã từng phải dùng máy mài để điều chỉnh bộ phận tản nhiệt ngay trong phòng họp để không làm gián đoạn không khí buổi tiệc pizza khi con chip Trainium3 gặp sự cố cơ học nhẹ lúc mới bắt đầu.

“Khách hàng của chúng tôi đang mở rộng nhanh đến mức chúng tôi không kịp sản xuất đủ dung lượng. Một ngày nào đó, Bedrock có thể sẽ lớn mạnh tương đương với dịch vụ khổng lồ EC2 của AWS,” – Kristopher King, Giám đốc phòng thí nghiệm chip AWS chia sẻ.

Tương lai của hạ tầng AI

Thỏa thuận với OpenAI đưa AWS trở thành nhà cung cấp độc quyền cho “Frontier” – trình xây dựng tác tử AI (AI agent builder) mới của OpenAI. Điều này cho thấy tầm nhìn của Amazon: không chỉ bán hạ tầng, mà còn làm chủ cả lớp phần cứng chuyên dụng nhất cho kỷ nguyên tác tử AI.

Dù áp lực từ sự thống trị của Nvidia vẫn còn đó, nhưng với sự chứng thực từ những cái tên hàng đầu như Apple (từng ca ngợi Graviton và Inferentia), Anthropic và giờ là OpenAI, đội ngũ chip của Amazon đang tự tin hơn bao giờ hết trong việc tái lập lại bản đồ hạ tầng AI toàn cầu.

Theo TechCrunch / Julie Bort

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *