有......" />
北京2025年8月5日 /美通社/ -- 亞馬遜云科技日前宣布,推出Amazon Nova Act SDK有限預(yù)覽版,可快速幫助客戶將基于瀏覽器的Agent從原型部署至生產(chǎn)環(huán)境。該SDK可與亞馬遜云科技的多項(xiàng)服務(wù)集成,包括用于安全身份管理的Amazon Identity and Access Management (Amazon IAM)、用于數(shù)據(jù)存儲(chǔ)與策略控制的Amazon Simple Storage Service (Amazon S3),以及全新推出的、支持大規(guī)模云端瀏覽器執(zhí)行的Amazon Bedrock AgentCore Browser Tool。
Amazon Nova Act SDK最初于2025年初以研究預(yù)覽版形式推出,旨在幫助開發(fā)者構(gòu)建可穩(wěn)定完成網(wǎng)頁任務(wù)的Agent。隨著企業(yè)對(duì)自動(dòng)化能力的需求不斷增長,該SDK在眾多實(shí)際業(yè)務(wù)場景中得以落地,成為推動(dòng)Agent流程自動(dòng)化的重要工具,具備高可靠性、靈活性與可擴(kuò)展性。
傳統(tǒng)業(yè)務(wù)自動(dòng)化流程面臨的挑戰(zhàn)
日常業(yè)務(wù)操作往往依賴瀏覽器,例如提交休假申請(qǐng)、處理發(fā)票、訪問供應(yīng)商門戶或查看儀表盤。由于缺乏API覆蓋,許多流程仍需手動(dòng)完成:團(tuán)隊(duì)需要在多個(gè)標(biāo)簽頁間復(fù)制粘貼數(shù)據(jù),手動(dòng)執(zhí)行多步驟流程,點(diǎn)擊大量界面來完成工作。
傳統(tǒng)基于規(guī)則的瀏覽器自動(dòng)化框架在動(dòng)態(tài)網(wǎng)頁環(huán)境中面臨諸多挑戰(zhàn)。頁面結(jié)構(gòu)的微小變化(如新增表單字段或下拉選項(xiàng))常常導(dǎo)致選擇器失效,團(tuán)隊(duì)需要投入大量精力進(jìn)行維護(hù),而非構(gòu)建新的自動(dòng)化任務(wù)。更重要的是,這類框架難以擴(kuò)展。例如,若某一業(yè)務(wù)場景需要在50個(gè)不同網(wǎng)站上運(yùn)行,團(tuán)隊(duì)就必須構(gòu)建50套特定自動(dòng)化邏輯,因?yàn)榛谝?guī)則的框架無法泛化。
人類執(zhí)行任務(wù)的能力可以適應(yīng)不同的工具和界面。例如,掌握了如何在Outlook中撰寫郵件后,即使從未使用過Gmail,也能在其中完成同樣的任務(wù)。大型語言模型(LLM)通過海量用戶界面訓(xùn)練樣本,賦予AI Agent類似于人類的這種識(shí)別能力。憑借語言理解、指令執(zhí)行和跨領(lǐng)域推理能力,大語言模型已廣泛應(yīng)用于聊天、摘要生成、編程助手等場景。如今,生成式AI正邁入"以行動(dòng)為核心"的新階段。Agentic AI在大語言模型基礎(chǔ)上向執(zhí)行層延伸,旨在完成動(dòng)態(tài)、多步驟的復(fù)雜流程,如填寫復(fù)雜表單、與不斷變化的界面交互,或大規(guī)模完成真實(shí)業(yè)務(wù)任務(wù)。Agentic AI并非取代大語言模型,而是對(duì)其進(jìn)行擴(kuò)展,釋放新的自動(dòng)化能力,讓我們?cè)谄髽I(yè)環(huán)境中更接近真正的任務(wù)完成。
借助Amazon Nova Act SDK實(shí)現(xiàn)Agentic AI
借助Amazon Nova Act SDK,客戶能夠構(gòu)建并部署可靠的瀏覽器Agent,這些Agent由專為Agentic AI打造并精調(diào)的Amazon Nova Act模型驅(qū)動(dòng)。該模型經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練,并結(jié)合大量瀏覽器交互領(lǐng)域數(shù)據(jù),能夠精準(zhǔn)執(zhí)行逐步工作流程。在最新版本中,亞馬遜云科技通過服務(wù)集成進(jìn)一步擴(kuò)展了這一功能,使客戶能夠?qū)gent從原型轉(zhuǎn)化為生產(chǎn)環(huán)境。用戶只需一條命令即可安裝SDK,使用Python和自然語言編寫Agent、實(shí)時(shí)調(diào)試,并可直接集成至持續(xù)集成與交付(CI/CD)流程中。通過亞馬遜云科技提供的企業(yè)級(jí)安全性、可觀測性和基礎(chǔ)設(shè)施,Amazon Nova Act SDK為希望構(gòu)建可大規(guī)模和可交付的Agent的團(tuán)隊(duì)提供了一條快速、靈活的路徑。用戶只需一條命令即可完成安裝,可使用Python和自然語言的組合方式編寫Agent,在工作流運(yùn)行期間進(jìn)行調(diào)試,并通過CI/CD流水線進(jìn)行部署。
Amazon Nova Act SDK還可與Amazon Bedrock AgentCore Browser Tool(一個(gè)快速、安全的云端瀏覽器)集成,支持AI Agent與網(wǎng)站進(jìn)行大規(guī)模交互。它具備企業(yè)級(jí)安全能力,包括虛擬機(jī)級(jí)別隔離與聯(lián)合身份集成。該工具還通過實(shí)時(shí)查看、Amazon CloudTrail日志記錄和會(huì)話重放等提供內(nèi)置的可觀測性,以支持故障排查、質(zhì)量維護(hù)和合規(guī)性要求。
Amazon Nova Act SDK的優(yōu)勢(shì)
Amazon Nova Act SDK可靠性高、部署快速,專為安全、大規(guī)模瀏覽器自動(dòng)化場景而構(gòu)建。
優(yōu)勢(shì)1——可靠性:構(gòu)建準(zhǔn)確度高、可重復(fù)性強(qiáng)的瀏覽器自動(dòng)化
借助Amazon Nova Act SDK,開發(fā)者可將復(fù)雜工作流拆解為可靠的原子命令(例如,收集網(wǎng)頁中的所有表單元素,并返回包含表單所有必填字段的字符串)。SDK支持添加詳細(xì)指令以根據(jù)需要優(yōu)化這些命令(例如,關(guān)閉彈窗橫幅),具備調(diào)用API的能力,并可選擇通過Playwright進(jìn)行直接瀏覽器操作以提升執(zhí)行可靠性(例如,在輸入密碼時(shí))。開發(fā)者可以在自動(dòng)化流程中穿插使用Python代碼,例如編寫測試用例、設(shè)置流程中斷點(diǎn)或判斷條件,以及采用并發(fā)任務(wù)機(jī)制來提升執(zhí)行效率,特別是在網(wǎng)頁加載速度受限的情況下,這些方式能有效優(yōu)化整體性能。最新版Amazon Nova Act SDK在早期企業(yè)級(jí)應(yīng)用中已展現(xiàn)出超過90%的可靠性,涵蓋自動(dòng)化質(zhì)檢、復(fù)雜表單處理和流程執(zhí)行等場景。推理能力與故障恢復(fù)機(jī)制的提升,使Agent能夠適應(yīng)不斷變化的用戶界面,持續(xù)穩(wěn)定地完成復(fù)雜操作序列。
優(yōu)勢(shì)2——上市速度:從原型到生產(chǎn)僅需數(shù)日,而非數(shù)周
Amazon Nova Act SDK專為加速自動(dòng)化開發(fā)而設(shè)計(jì),無需依賴脆弱的腳本邏輯。客戶可通過一條命令完成SDK安裝,使用Python、自然語言或二者結(jié)合定義Agent,邊運(yùn)行邊調(diào)試流程、檢查網(wǎng)頁的結(jié)構(gòu)化頁面元素(DOM)、設(shè)置步驟間的暫停點(diǎn),并快速迭代優(yōu)化。該SDK支持以下功能:
客戶無需更改現(xiàn)有基礎(chǔ)設(shè)施或重構(gòu)內(nèi)部工具鏈,基于Amazon Nova Act構(gòu)建的agent可無縫融入當(dāng)前開發(fā)流程,助力從試驗(yàn)階段快速邁入生產(chǎn)環(huán)境。
優(yōu)勢(shì)3——安全性:依托亞馬遜云科技,部署值得信賴的自動(dòng)化流程
Amazon Nova Act SDK集成了Amazon IAM實(shí)現(xiàn)訪問控制,模型訪問方式與其他亞馬遜云科技服務(wù)一致。該SDK支持在macOS、Linux、Windows和WSL2等系統(tǒng)上運(yùn)行,運(yùn)行時(shí)環(huán)境彼此隔離,輸入、輸出數(shù)據(jù)均支持加密處理。Amazon Nova Act SDK專為企業(yè)環(huán)境設(shè)計(jì),具備生產(chǎn)系統(tǒng)所需的可靠性、可觀測性與安全性。
實(shí)際應(yīng)用展示:自動(dòng)化信息采集,加速金融決策流程
在金融服務(wù)領(lǐng)域——特別是投資銀行、并購咨詢和戰(zhàn)略研究等場景中,成敗往往取決于團(tuán)隊(duì)能多快、多準(zhǔn)地將碎片化的公開數(shù)據(jù)轉(zhuǎn)化為可執(zhí)行的洞察。
Amazon Nova Act SDK應(yīng)用場景
當(dāng)今企業(yè)中瀏覽器相關(guān)的業(yè)務(wù)流程極為常見,但許多仍依賴手動(dòng)操作,重復(fù)性高且易出錯(cuò)。Amazon Nova Act SDK幫助企業(yè)自動(dòng)化這些任務(wù),使團(tuán)隊(duì)能夠?qū)W⒂诟邇r(jià)值的工作,提升準(zhǔn)確率,減少運(yùn)營延遲。憑借其高可靠性,該SDK可適配多個(gè)行業(yè)與業(yè)務(wù)場景。
場景1——自動(dòng)化數(shù)據(jù)錄入與表單填寫
Amazon Nova Act SDK通過自動(dòng)化處理表單提交、文件上傳與數(shù)據(jù)更新,減少在基于Web的系統(tǒng)(如CRM、人力資源工具、財(cái)務(wù)平臺(tái))中的重復(fù)人工輸入。在醫(yī)療場景中,工作人員需協(xié)助用戶完成各州差異化極大的福利申請(qǐng)流程;而公共部門的個(gè)案工作者也常需在多個(gè)系統(tǒng)中重復(fù)錄入家庭數(shù)據(jù)。Amazon Nova Act SDK能夠穩(wěn)定處理這些動(dòng)態(tài)流程,可靠應(yīng)對(duì)字段變動(dòng)、下拉菜單及彈窗,無需依賴脆弱腳本或定制代碼。
Rackspace Technology是一家混合架構(gòu)與AI解決方案服務(wù)商,正在與Alvee Health合作,利用Amazon Nova Act SDK實(shí)現(xiàn)公共福利成員的自動(dòng)注冊(cè)。Alvee首席執(zhí)行官Nicole Cook表示:"許多公共項(xiàng)目的注冊(cè)表單又長又復(fù)雜,很多成員因此錯(cuò)過本可獲得的幫助。通過Amazon Nova Act SDK,并結(jié)合Alvee系統(tǒng)中已有的信息,我們不僅簡化了繁瑣文書工作,更實(shí)現(xiàn)了對(duì)健康生活資源的及時(shí)、精準(zhǔn)連接。我們預(yù)計(jì)該方案可使福利成功注冊(cè)率提升30%,整體個(gè)案處理能力提升多達(dá)10倍,幫助醫(yī)療服務(wù)提供者將更多精力投入患者關(guān)懷,而非行政事務(wù)。這正是AI技術(shù)助力公共福祉、提升社區(qū)健康水平的典型示例。"
場景2——為客戶支持賦能
在零售、旅游及SaaS等行業(yè),客戶支持團(tuán)隊(duì)往往需要在內(nèi)部工具與第三方門戶之間頻繁切換,以完成服務(wù)工單。例如,零售員工可能需在合作方網(wǎng)站上提交退貨申請(qǐng),旅行顧問可能需登錄航空公司后臺(tái)請(qǐng)求賠償,技術(shù)支持人員則可能需在客戶管理后臺(tái)重置授權(quán)碼。Amazon Nova Act SDK能夠自動(dòng)執(zhí)行這些基于瀏覽器的操作,幫助agent專注于客戶對(duì)話的同時(shí),后臺(tái)任務(wù)可高效、可靠地完成。
差旅與費(fèi)用管理平臺(tái)Navan正在使用Amazon Nova Act SDK,通過自動(dòng)化填寫不同供應(yīng)商的付款表單,簡化旅行顧問的操作流程。Navan產(chǎn)品高級(jí)副總裁Yuval Refua表示:"將Amazon Nova Act SDK集成進(jìn)agent工作流程后,我們極大減少了重復(fù)性任務(wù),這是擴(kuò)展運(yùn)營規(guī)模、服務(wù)更多客戶的關(guān)鍵一步。我們也嘗試過其他自動(dòng)化工具,但Amazon Nova Act在可靠性與靈活性上的表現(xiàn),使我們能用同一個(gè)腳本完成多個(gè)酒店品牌不同付款表單的填寫任務(wù)。目前我們正擴(kuò)展該自動(dòng)化覆蓋范圍,預(yù)期可進(jìn)一步提升運(yùn)營能力,更高效地滿足日益增長的客戶需求。"
場景3——自動(dòng)化高風(fēng)險(xiǎn)管理流程
資質(zhì)驗(yàn)證、身份核查及其他高度依賴合規(guī)的任務(wù),常需在上百個(gè)界面結(jié)構(gòu)各異的第三方門戶中操作。Amazon Nova Act SDK使這些流程的自動(dòng)化成為可能,兼具高準(zhǔn)確率、靈活性與可控性,助力團(tuán)隊(duì)在擴(kuò)展規(guī)模的同時(shí)保持精準(zhǔn)度。
全球Agent流程自動(dòng)化(Agentic Process Automation, APA)領(lǐng)導(dǎo)者Automation Anywhere正通過Amazon Nova Act SDK拓展其自動(dòng)化能力,率先開展專業(yè)資質(zhì)驗(yàn)證這一高風(fēng)險(xiǎn)、重復(fù)性強(qiáng)的關(guān)鍵任務(wù),該任務(wù)對(duì)于合規(guī)性、成員安全與日常運(yùn)營至關(guān)重要。Automation Anywhere首席產(chǎn)品官Adi Kuruganti表示:"通過將Amazon Nova Act SDK深度集成進(jìn)我們的流程推理引擎(Process Reasoning Engine,PRE),我們?cè)谄髽I(yè)自動(dòng)化的‘計(jì)算執(zhí)行能力'方面實(shí)現(xiàn)了重大突破。我們的目標(biāo)導(dǎo)向型AI agent不僅僅是點(diǎn)擊模擬器,而是能夠?qū)崟r(shí)理解并推理基于UI的流程,具備如同人類專家般的網(wǎng)站操作能力。這為此前難以實(shí)現(xiàn)的自動(dòng)化場景打開了通路,例如醫(yī)療項(xiàng)目注冊(cè)測試等對(duì)準(zhǔn)確性與可擴(kuò)展性要求極高的任務(wù)。"
場景4——動(dòng)態(tài)界面下的用戶體驗(yàn)與質(zhì)量測試
在銀行、保險(xiǎn)、政府等行業(yè),用戶體驗(yàn)(UX)與質(zhì)量保證(QA)測試通常需要模擬用戶在動(dòng)態(tài)網(wǎng)站上的真實(shí)操作。通過Amazon Nova Act SDK,團(tuán)隊(duì)可以使用自然語言或Python編寫與更新測試用例,快速響應(yīng)UI變化,無需依賴脆弱的選擇器或頻繁手動(dòng)改寫腳本。
Tyler Technologies是面向公共部門的一體化軟件與技術(shù)服務(wù)領(lǐng)先提供商,正在利用Amazon Nova Act SDK實(shí)現(xiàn)軟件測試自動(dòng)化,提升版本發(fā)布的可靠性。Tyler Technologies數(shù)據(jù)與洞察部門總裁Franklin Williams表示:"Amazon Nova Act提供的自然語言接口讓我們能在數(shù)分鐘內(nèi)將原本的手動(dòng)測試計(jì)劃轉(zhuǎn)化為自動(dòng)化測試套件,無需編寫任何代碼,這不僅為我們節(jié)省了數(shù)百小時(shí)的工作量,也大幅擴(kuò)展了測試覆蓋范圍并提升了產(chǎn)品質(zhì)量。目前我們正計(jì)劃在公司全產(chǎn)品線中進(jìn)一步推廣Nova Act SDK的使用。"
Amazon Nova Act SDK的未來
亞馬遜云科技正與早期客戶密切合作,共同推動(dòng)Amazon Nova Act SDK的發(fā)展路線圖。盡管當(dāng)前聚焦于瀏覽器相關(guān)的工作流程,Amazon Nova Act SDK實(shí)際上是亞馬遜云科技打造"可在多種環(huán)境中穩(wěn)定運(yùn)行的Agent"的更廣泛戰(zhàn)略組成部分。我們正持續(xù)將模型能力從Web拓展至更復(fù)雜的現(xiàn)實(shí)任務(wù)中,并將強(qiáng)化學(xué)習(xí)應(yīng)用于更多真實(shí)業(yè)務(wù)流程。同時(shí),Amazon Nova Act SDK也在不斷深化與亞馬遜云科技生態(tài)的集成,幫助開發(fā)者更高效地從原型構(gòu)建邁向安全、可擴(kuò)展的Agent系統(tǒng)部署。
立即開始使用Amazon Nova Act SDK
Amazon Nova Act SDK研究預(yù)覽版現(xiàn)已開放,技術(shù)負(fù)責(zé)人與開發(fā)者可前往Amazon Nova Act頁面獲取訪問權(quán)限,開始構(gòu)建原型。該SDK提供穩(wěn)定、逐步執(zhí)行的瀏覽器自動(dòng)化工具,面向真實(shí)業(yè)務(wù)流程而非演示用途。
Amazon AGI Lab是亞馬遜的應(yīng)用研究團(tuán)隊(duì),致力于構(gòu)建能夠在數(shù)字與物理環(huán)境中執(zhí)行真實(shí)任務(wù)的AI agent;其研究方向涵蓋大語言模型(LLM)、強(qiáng)化學(xué)習(xí)、世界建模等多個(gè)領(lǐng)域。更多信息及最新技術(shù)進(jìn)展可通過Amazon AGI Labs頁面獲取。