Random Labs, startup được Y Combinator hậu thuẫn, ra mắt Slate V1 - agent lập trình 'bầy đàn' đầu tiên

Startup Random Labs vừa chính thức ra mắt Slate V1, một agent lập trình tự hành được mô tả là 'bản địa bầy đàn' (swarm-native) đầu tiên trong ngành. Công cụ này sử dụng kiến trúc 'Dệt Luồng' (Thread Weaving) độc đáo để điều phối nhiều mô hình AI cùng lúc, giải quyết các tác vụ kỹ thuật phức tạp với hiệu suất song song quy mô lớn.
Nghịch lý của kỷ nguyên AI trong ngành kỹ thuật phần mềm
Thế giới kỹ thuật phần mềm đang phải đối mặt với một nghịch lý cơ bản của kỷ nguyên AI: khi các mô hình ngày càng mạnh mẽ, "bài toán hệ thống" trong việc quản lý chúng lại trở thành rào cản chính đối với năng suất thực tế. Mặc dù một lập trình viên có thể tiếp cận trí tuệ thô của một mô hình tiên tiến, trí tuệ đó thường suy giảm ngay khi một tác vụ đòi hỏi tầm nhìn dài hạn hoặc một cửa sổ ngữ cảnh sâu.
Tuy nhiên, giải pháp dường như đã xuất hiện. Random Labs, một startup tại San Francisco được Y Combinator hậu thuẫn, đã chính thức ra mắt Slate V1. Công cụ này được mô tả là agent lập trình tự hành "bản địa bầy đàn" (swarm-native) đầu tiên trong ngành, được thiết kế để thực thi các tác vụ kỹ thuật phức tạp và song song ở quy mô lớn.
Sau giai đoạn open beta, công cụ này sử dụng một "thuật toán cắt tỉa động" để duy trì ngữ cảnh trong các codebase lớn, đồng thời mở rộng quy mô đầu ra để đáp ứng độ phức tạp của doanh nghiệp. Được đồng sáng lập bởi Kiran và Mihir Chintawar vào năm 2024, công ty đặt mục tiêu giải quyết tình trạng thiếu hụt kỹ sư toàn cầu bằng cách định vị Slate như một công cụ cộng tác cho "20 triệu kỹ sư tiếp theo" thay vì thay thế con người.
Kiến trúc 'Bầy Đàn' và Triết lý 'Dệt Luồng'
Với việc phát hành Slate V1, đội ngũ tại Random Labs đang cố gắng kiến tạo một lối thoát bằng cách giới thiệu môi trường lập trình agent "bản địa bầy đàn" đầu tiên. Slate không chỉ đơn thuần là một lớp vỏ (wrapper) hay một chatbot có quyền truy cập tệp; nó là sự hiện thực hóa triết lý "trí tuệ bầy đàn" (hive mind) được thiết kế để mở rộng quy mô công việc của agent theo độ phức tạp của một tổ chức con người.
Bằng cách tận dụng một nguyên mẫu kiến trúc mới lạ có tên Thread Weaving (Dệt Luồng), Slate vượt qua các cây tác vụ cứng nhắc và các phương pháp nén mất dữ liệu đã định hình thế hệ trợ lý lập trình AI đầu tiên.
Chiến lược: Lập trình trong không gian hành động
Trọng tâm hiệu quả của Slate là sự tương tác sâu sắc với Mô hình Ngôn ngữ Đệ quy (RLM).
Trong một hệ thống truyền thống, một agent có thể được yêu cầu "sửa một lỗi", một câu lệnh buộc mô hình phải xử lý đồng thời cả chiến lược cấp cao và thực thi cấp thấp. Random Labs xác định đây là một thất bại trong việc khai thác "Lượng tri thức tiềm ẩn" (Knowledge Overhang)—trí thông minh tiềm ẩn mà một mô hình sở hữu nhưng không thể truy cập hiệu quả khi bị quá tải về mặt chiến thuật.
Slate giải quyết vấn đề này bằng cách sử dụng một luồng điều phối trung tâm, về cơ bản là "lập trình trong không gian hành động". Luồng điều phối này không trực tiếp viết mã; thay vào đó, nó sử dụng một DSL dựa trên TypeScript để phân công các luồng công nhân song song xử lý các tác vụ cụ thể, có giới hạn.
Điều này tạo ra sự tách biệt rõ ràng giữa "nhân" (kernel)—quản lý đồ thị thực thi và duy trì định hướng chiến lược—và các "tiến trình" công nhân thực thi các hoạt động chiến thuật trong terminal. Bằng cách ánh xạ sang một khuôn khổ kiểu hệ điều hành, lấy cảm hứng từ khái niệm "LLM OS" của Andrej Karpathy, Slate có thể coi cửa sổ ngữ cảnh giới hạn của một mô hình như bộ nhớ RAM quý giá, chủ động và thông minh quản lý những gì được giữ lại và những gì bị loại bỏ.
Bộ nhớ theo từng hồi và sức mạnh của 'bầy đàn'
Sự đổi mới thực sự của phương pháp "Dệt Luồng" nằm ở cách nó xử lý bộ nhớ. Hầu hết các agent ngày nay đều dựa vào "nén dữ liệu" (compaction), thường chỉ là một thuật ngữ mỹ miều cho việc nén mất dữ liệu có nguy cơ làm mất trạng thái quan trọng của dự án. Thay vào đó, Slate tạo ra các "hồi" (episodes).
Khi một luồng công nhân hoàn thành một tác vụ, nó không trả về một bản ghi dài dòng về mọi nỗ lực thất bại; nó trả về một bản tóm tắt cô đọng về các lệnh gọi công cụ thành công và các kết luận. Bởi vì các "hồi" này chia sẻ ngữ cảnh trực tiếp với luồng điều phối thay vì dựa vào việc truyền thông điệp dễ bị lỗi, hệ thống duy trì được một trí thông minh "bầy đàn".
Kiến trúc này cho phép xử lý song song ở quy mô lớn. Một lập trình viên có thể để Claude Sonnet điều phối một tác vụ tái cấu trúc phức tạp trong khi GPT-5.4 thực thi mã, và GLM 5—một mô hình được ưa chuộng vì khả năng tìm kiếm agentic—đồng thời nghiên cứu tài liệu thư viện ở chế độ nền. Đây là một cách tiếp cận tương tự như Perplexity đã làm với agent đa mô hình Computer mới của họ.
Bằng cách chọn "đúng mô hình cho đúng việc", Slate đảm bảo rằng người dùng không chi tiêu quá mức cho trí tuệ cho các bước chiến thuật đơn giản trong khi vẫn được hưởng lợi từ chiều sâu chiến lược của các mô hình mạnh nhất thế giới.
Mô hình kinh doanh và Tầm nhìn
Từ góc độ thương mại, Random Labs đang điều hướng giai đoạn beta ban đầu với sự kết hợp giữa tính minh bạch và sự mơ hồ chiến lược. Mặc dù công ty chưa công bố bảng giá đăng ký cố định, tài liệu về Slate CLI xác nhận sự chuyển đổi sang mô hình tín dụng dựa trên mức sử dụng.
Các lệnh như /usage và /billing cho phép người dùng theo dõi mức tiêu thụ tín dụng của họ theo thời gian thực, và việc bao gồm các tùy chọn thanh toán cấp tổ chức cho thấy sự tập trung rõ ràng vào các đội ngũ kỹ sư chuyên nghiệp thay vì những người dùng cá nhân.
Khả năng tích hợp cũng là một yếu tố quan trọng. Random Labs gần đây đã thông báo rằng việc hỗ trợ trực tiếp cho Codex của OpenAI và Claude Code của Anthropic dự kiến sẽ được phát hành vào tuần tới. Điều này cho thấy Slate không cố gắng cạnh tranh với các giao diện gốc của các mô hình này, mà là đóng vai trò như một lớp điều phối vượt trội cho phép các kỹ sư sử dụng tất cả chúng cùng một lúc, một cách an toàn và hiệu quả về chi phí.
Về mặt kiến trúc, hệ thống được thiết kế để tối đa hóa việc lưu vào bộ nhớ đệm thông qua việc tái sử dụng luồng con, một thủ thuật "kỹ thuật ngữ cảnh mới lạ" mà đội ngũ tuyên bố giúp phương pháp tiếp cận bầy đàn không trở thành gánh nặng tài chính cho người dùng.
Hiệu suất ấn tượng và Tương lai
Lập luận thuyết phục nhất cho kiến trúc của Slate có lẽ là sự ổn định của nó. Trong thử nghiệm nội bộ, một phiên bản ban đầu của hệ thống luồng này đã vượt qua 2/3 bài kiểm tra trong tác vụ make-mips-interpreter thuộc bộ Terminal Bench 2.0. Đây là một tác vụ mà ngay cả các mô hình tiên tiến nhất như Opus 4.6 thường chỉ thành công dưới 20% khi được sử dụng trong các môi trường tiêu chuẩn, không có điều phối.
Thành công này trong một môi trường "biến đổi" hoặc thay đổi là điều phân biệt một công cụ với một đối tác. Theo tài liệu của Random Labs, một nhà sáng lập công ty fintech ở New York đã mô tả Slate là "công cụ gỡ lỗi tốt nhất" của họ, một tình cảm phản ánh mục tiêu rộng lớn hơn của Random Labs: xây dựng các agent không chỉ hoàn thành một câu lệnh, mà còn có thể mở rộng quy mô như một tổ chức.
Khi ngành công nghiệp vượt qua các giao diện "trò chuyện với mã" đơn giản, kiến trúc "Dệt Luồng" của Slate V1 mang đến một cái nhìn thoáng qua về một tương lai nơi vai trò chính của kỹ sư con người là chỉ đạo một trí tuệ bầy đàn gồm các mô hình chuyên biệt, mỗi mô hình hoạt động phối hợp để giải quyết các vấn đề dài hạn của phần mềm hiện đại.
Nguồn: VentureBeat

