[Build 2024] Tóm tắt sự kiện

Microsoft đã giới thiệu một loạt dịch vụ tích hợp AI mới nhắm đến các doanh nghiệp và người tiêu dùng tại hội nghị nhà phát triển Build hàng năm của mình.

Các bản cập nhật được công bố tại Microsoft Build 2024 là cách công ty đảm bảo các nhà phát triển có đủ công cụ để tạo ra kho sản phẩm hỗ trợ AI.

AI doanh nghiệp là động lực thúc đẩy chiến lược AI của Google và Microsoft, mặc dù các sáng kiến lấy người tiêu dùng làm trung tâm cũng không kém cạnh.

Một tuần sau Google I/O 2024, Microsoft sẽ chiếm vị trí trung tâm tại hội nghị nhà phát triển thường niên ở Seattle vào tuần này. Vào thứ Tư, công ty đã tổ chức bài phát biểu quan trọng dành cho nhà phát triển của Microsoft Build 2024, công bố một loạt sản phẩm và dịch vụ mới cũng như kế hoạch hành động nhằm đảm bảo vị trí dẫn đầu trong lĩnh vực AI.

AI doanh nghiệp là động lực thúc đẩy chiến lược AI của Google và Microsoft, mặc dù các sáng kiến lấy người tiêu dùng làm trung tâm cũng không kém cạnh.

Tuy nhiên, liệu việc đưa AI hoặc AI sáng tạo vào mọi sản phẩm hiện có và sản phẩm mới có phải là hướng đi đúng đắn? Xem những điểm nổi bật từ Microsoft Build 2024.

Cập nhật Copilot

Team Copilot là dịch vụ AI tổng hợp của Redmond dành cho người dùng Microsoft 365 và Teams. Nó vượt xa việc cung cấp trải nghiệm trò chuyện. Nó được xây dựng trên chatbot Microsoft Copilot để cho phép quản lý chương trình làm việc, ghi chú, kiểm duyệt cuộc trò chuyện và trả lời câu hỏi theo ngữ cảnh. 

Nhóm Copilot chủ động và tự động tham gia để cải thiện sự hợp tác và hợp lý hóa việc quản lý dự án, như công ty đã lưu ý. “Team Copilot mở rộng Copilot ngoài vai trò trợ lý cá nhân để hoạt động như một thành viên có giá trị trong nhóm—tham gia và đóng góp cùng với nhóm. Và tất nhiên, bạn luôn nắm quyền kiểm soát—giao nhiệm vụ hoặc trách nhiệm cho Copilot để cả nhóm có thể cùng nhau làm việc hiệu quả, hợp tác và sáng tạo hơn,” Microsoft viết.

Công ty cũng đã phát hành các khả năng tích hợp mới trong Microsoft Copilot Studio để người dùng xây dựng các Copilot tùy chỉnh có thể giúp tự động hóa một số khía cạnh hoạt động của doanh nghiệp.

Chương trình truy cập sớm của Microsoft cung cấp Team Copilot và các tính năng xây dựng tác nhân tùy chỉnh. Dự kiến triển khai rộng rãi vào cuối năm 2024.

Copilots+ PC

Về mặt kỹ thuật, Copilot+ PC đã được ra mắt một ngày trước bài phát biểu quan trọng về Microsoft Build 2024 vào thứ Ba. Tuy nhiên, phần cứng dựa trên Windows mới của Microsoft đã giành được một vị trí trong danh sách các điểm nổi bật của Build 2024 khi công ty tìm cách sửa đổi PC AI.

Các công ty đang chạy đua để có được AI trên thiết bị và mặc dù Microsoft có thể chưa giải được mã, nhưng chắc chắn đây vẫn là một trong những công ty đi trước, với mối đe dọa rõ ràng duy nhất từ các máy trạm chạy chip dòng M của Apple.

Microsoft đã giới thiệu Surface Pro và Surface Laptop dưới dạng Copilot+ PC mới, cùng với các lựa chọn thay thế từ ASUS, Dell, Samsung, Acer, Lenovo và HP. Chất bán dẫn của Intel, Qualcomm và AMD sẽ cung cấp năng lượng cho Copilot+ PC, được Microsoft tuyên bố nhanh hơn 58% so với MacBook Air M3.

“Được kết nối và nâng cao bởi các mô hình ngôn ngữ lớn (LLM) chạy trong Đám mây Azure của chúng tôi cùng với các mô hình ngôn ngữ nhỏ (SLM), Copilot+ PC giờ đây có thể đạt được mức hiệu suất chưa từng thấy trước đây. Chúng mạnh hơn tới 20 lần và hiệu quả hơn tới 100 lần khi chạy khối lượng công việc AI và mang lại khả năng tăng tốc AI hàng đầu trong ngành”, Microsoft viết.

‘Recall’ nổi bật là một trong những Copilot+ PC có thể được nhiều người đánh giá cao. Nó cho phép bộ nhớ ảnh dựa trên ảnh chụp nhanh và được hỗ trợ bởi AI để truy cập mọi thứ người dùng đã xem hoặc thực hiện trên thiết bị. Việc thu hồi có thể hữu ích nhưng có vẻ như có rủi ro về quyền riêng tư vì nó chụp ảnh màn hình mọi thứ mà người dùng điều hướng.

May mắn thay, quá trình xử lý diễn ra trên thiết bị và công cụ Windows Semantic Index cho phép người dùng kiểm soát những gì máy có thể nhìn thấy và lưu trữ để Thu hồi.

Copilot+ PC cũng nhắm đến các chuyên gia sáng tạo thông qua công cụ Cocreator, giúp thực hiện các tác vụ tạo hình ảnh trong các ứng dụng của bên thứ ba, bao gồm Adobe Photoshop, DaVinci Resolve, CapCut, v.v.

Copilot+ PC có giá khởi điểm là 999 USD và có sẵn để đặt hàng trước trước khi lên kệ rộng rãi vào ngày 18 tháng 6.

Mô hình ngôn ngữ nhỏ Phi-3-vision

Microsoft đã bổ sung Phi-3-vision vào nhóm mô hình ngôn ngữ nhỏ (SML). Hiện đang ở giai đoạn xem trước, Phi-3-vision được thiết kế cho các tác vụ đòi hỏi nhiều tính toán ở mức độ thấp, chẳng hạn như trên thiết bị di động và thiết bị IoT. Nó bao gồm khả năng suy luận trực quan với tính đa phương thức mở rộng sang văn bản và hình ảnh, mặc dù nó không thể tạo ra hình ảnh.

Khả năng đa phương thức của nó, cùng với 4,2 tỷ tham số và độ dài ngữ cảnh 28K, cho phép nó sao chép văn bản từ hình ảnh, khiến nó trở thành công cụ lý tưởng để phân tích hình ảnh, biểu đồ, bảng hoặc đồ thị.

Không rõ khi nào Phi-3-vision sẽ có sẵn rộng rãi, mặc dù Phi-3-medium, Phi-3-small và hiện tại Phi-3-mini đã có sẵn trên Azure.

Đối thủ tinh thần của Phi-3-vision, PaliGemma của Google, một công cụ chấp nhận thông tin hình ảnh và dịch nó sang ngôn ngữ viết của con người, đã được phát hành vào đầu tháng 5. SLM của Google có ít tham số hơn (ba tỷ), đây không thực sự là một công cụ phá vỡ thỏa thuận nhưng có sẵn cho các nhà phát triển.

Microsoft tuyên bố Phi-3-vision vượt trội hơn Claude-3 Haiku, Llava-1.6 Vicuna 7B và Gemini 1.0 Pro V trên nhiều điểm chuẩn.

Bộ công cụ phát triển Snapdragon

Tại Build 2024, Qualcomm đã giới thiệu Snapdragon Dev Kit, được phát triển với sự hợp tác của Microsoft. Giống như kiểu dáng của Mac Mini, nó được cung cấp bởi Snapdragon X Elite và hầu như chỉ phục vụ cho các nhà phát triển.

Bên cạnh chip Arm64, Snapdragon Dev Kit dành cho Windows còn có GPU Adreno 4,6 TFLOP, NPU Qualcomm Hexagon 45 TOPS, bộ nhớ NVMe 512GB, RAM LPDDR5x 32 GB, năm cổng USB, mỗi cổng ethernet và một cổng HDMI, để cho phép xây dựng, thử nghiệm và chuyển giao trải nghiệm AI mới và ứng dụng gốc.

Nó có kích thước 8” x 7” x 1,3” và nặng 970 gram, có giá 899 USD.

Tích hợp Microsoft File Explorer với Git

Việc tích hợp Microsoft File Explorer với Git mang lại sự tiện lợi trong việc quản lý và theo dõi các dự án mã hóa trong chương trình gốc của Windows. Nó cho phép theo dõi trạng thái tệp, cam kết thư và các nhánh của chúng từ bên trong File Explorer, hiện cũng hỗ trợ nén 7-zip và TAR.

Quan hệ đối tác của Microsoft

Microsoft đang hợp tác với Meta để đưa Ứng dụng Windows Volumetric của mình vào tai nghe Quest. Mục đích là “mở rộng các ứng dụng Windows sang không gian 3D”, do đó cho phép người dùng Microsoft thường xuyên sử dụng các công cụ tương tự nhưng trên nền tảng điện toán không gian mới.

Đây là lời chào hàng của Microsoft dành cho các nhà phát triển quan tâm đến việc đăng ký bản xem trước:

“Microsoft đang tìm kiếm các nhà phát triển sản xuất hoặc cung cấp plug-in cho các ứng dụng máy tính để bàn Windows 3D hoặc những khách hàng làm việc với các ứng dụng 3D trên các ứng dụng máy tính để bàn Windows, những người quan tâm đến việc mở rộng các ứng dụng đó thành nội dung 3D với thực tế hỗn hợp. Nếu đây là bạn, vui lòng đăng ký quan tâm tại đây.”

Ngoài Meta, công ty còn mở rộng hợp tác với Hugging Face để đưa các mô hình ngôn ngữ lớn sau này đến studio Azure AI.

Mặt khác, sự hợp tác của Redmond với Khan Academy có vẻ giống như một hoạt động gia đình, vì nó sẽ cho phép viện giáo dục cung cấp cho các nhà giáo dục K-12 có trụ sở tại Hoa Kỳ quyền truy cập miễn phí (trước đây có giá 4 đô la mỗi tháng) vào đại lý Khanmigo for Teachers AI thông qua Azure OpenAI dịch vụ. Điều quan trọng không kém là Khan Academy sẽ có quyền truy cập vào các LLM khác, chẳng hạn như GPT-4, DALL-E 3, GPT-4o, v.v.

Hơn nữa, sự hợp tác này còn bao gồm việc phát triển mô hình ngôn ngữ nhỏ nguồn mở dựa trên Phi-3 được Khan Academy đào tạo về nội dung giáo dục (câu hỏi toán và câu trả lời từng bước) sẽ được sử dụng để dạy kèm toán. 

Sal Khan, người sáng lập Khan Academy, cho biết: “Nếu chúng có thể so sánh được với các mô hình tiên tiến lớn hơn nhưng với chi phí thấp hơn đáng kể, thì điều đó sẽ tăng đáng kể tốc độ chúng tôi có thể giúp nhiều người tiếp cận được sản phẩm này hơn”. Khan đặt mục tiêu chạy các ứng dụng học tập dựa trên AI tại địa phương trong tương lai.

Chuyến thăm bất ngờ

Giám đốc điều hành Microsoft Satya Nadella gọi mối quan hệ hợp tác của công ty với OpenAI là “chiến lược nhất, quan trọng nhất”. Để đạt được mục tiêu đó, CTO Kevin Scott của Microsoft đã mời Giám đốc điều hành OpenAI Sam Altman lên sân khấu để thảo luận về cách chúng tôi đến được đây và tương lai sẽ ra sao.

Mặc dù nghe có vẻ tầm thường nhưng dự đoán quan trọng nhất của Altman là các mô hình AI sẽ tiếp tục phát triển và trở nên thông minh hơn, đồng thời tiện ích của chúng sẽ tăng lên nhanh chóng. OpenAI nhằm mục đích nâng cao tốc độ, chi phí và các tính năng đa phương thức của từng mô hình kế tiếp.

Tuy nhiên, Altman đã không giải quyết được cuộc tranh cãi mới nhất mà OpenAI vướng vào khi Scarlett Johansson nói rằng cô ấy “bị sốc” và “tức giận” trước giọng nói của một chatbot OpenAI giống giọng của cô ấy. Dòng tweet “cô ấy” của Altman, có thể ám chỉ vai trò của Johansson trong việc lồng tiếng cho một đặc vụ AI trong phim Her, chắc chắn không giúp ích được gì.