廣州10bet智能科技有限公司
聯係人 :李先生
電話 :15113863131
郵箱 :5867003@qq.com
網址 :
地址 :廣州市南沙區安廣高新產業園廣興路25號2樓
地址 :廣州市天河區黃村東路29號201室
人工智能技術(AI)從上世紀五十年代提出以來 ,已經經曆了七十多年的發展 ,但人工智能成為全社會關注的基礎性技術 ,進而成為全球各國極為重視的關鍵戰略發展方向 ,還是最近十年的事情 。在這短短的十年中 ,人工智能技術得到了井噴式的發展 ,人工智能的加速演進引領著各行各業加速向智能化躍升 。
現代人工智能的出現 ,首先從基於深度學習技術的感知智能開始 ,我們稱為AI 1.0時代 。所謂感知智能 ,是讓機器真正具備像人一樣的視覺 、聽覺 、觸覺等感知能力 ,這是人工智能在安防領域最為成功的落地應用 ,比如對感興趣特定目標的檢測與分析 。另一方麵 ,人們顯然不滿足於人工智能隻是看到 、聽到和加工信息 ,而是希望機器能像人一樣進行學習 、思考和推理 ,這就進入了認知智能的領域。近兩年來 ,隨著大模型的興起 ,人工智能技術邁向認知智能的步伐已大大加快 ,有了突飛猛進的發展 。可以預見 ,AI 2.0時代會是一道分界線 ,2.0以下我們認為是傳統深度學習模型 ,2.0之後 ,更多的大模型技術不斷湧現並將逐漸成為主導 。當然 ,AI 2.0不是人工智能技術的終點 ,展望未來我們希望機器能真正成為人工大腦 ,代替人類進行決策判斷 ,這是我們稱之為AI 3.0的決策智能時代 。對現在人工智能技術來說 ,要達到這一頂峰還有很長的一段路要走 。
現代人工智能的發展 ,為像科達這樣的安防廠商帶來了全新的活力和機遇 。科達從2014年就推出了第一台感知型攝像機 ,代表著我們從感知智能進入了現代人工智能賽道;2017年 ,科達提出了“安防+AI”的戰略 ;2020年 ,科達在業界率先提出了AI像素級推理 、AI超微光 、AIISP的概念 ,引領了業界技術潮流 ;最近這兩年科達積極投入到大模型的研發當中 。科達基於現代人工智能的九年技術沉澱 ,為公司安防產品 、業務服務和解決方案帶來了極大的收益 ,湧現了一個又一個明星產品 ,這些產品不僅為科達創造了經濟價值 ,而且也保障了社會公共安全 ,產生了良好的社會效益 。
►
一、AI 1.0時代 :
基於深度學習的感知智能
感知智能是指將物理世界的信號通過攝像頭等傳感器采集設備
,借助人工智能算法等前沿技術
,映射到數字信息世界
,將多元數據結構化
,並用人類熟悉的方式去溝通和互動
。這一願望的最終實現
,完全得益於十年前出現的深度學習算法
,帶來了我們稱之為AI1.0的技術革命
。
深度學習算法通過大量的數據訓練來學習特征 ,並不斷優化模型 ,可以處理複雜的數據結構和非線性問題 ,實現高精度的預測和分類 。其最大的優點是無需手動設計挑選特征 ,隻要有數據 ,機器自動學習目標的最佳特征 ,這就大大減少了機器感知過程中的人工幹預 ,為機器實現感知智能提供了最重要的基礎支撐 。
在安防監控行業 ,最為常見的深度學習算法就是對人 、車 、物等感興趣目標的分析 。比如 ,與人相關的人像識別 ,與車輛相關的車輛壞損分析以及非機動車的識別和屬性分析 ,和對其它特定物體的分析 ,如船舶 、動物 、文字等等 。當前 ,這些基於深度學習的感知智能算法已經成為了安防領域各個應用中必不可少的工具 ,不僅大大減輕了人類的工作量 ,而且通過感知智能 ,機器能夠比人工看得更清楚 ,分析得更準確。因此 ,AI1.0的感知智能算法在安防應用中已經占據了重要地位 。
►
二、AI 2.0時代 :
大模型驅動的認知智能
感知隻是人類的基本能力之一
,人們希望AI能夠具備人類最重要的認知能力
,為我們做更多的事情
。以安防應用為例
,我們不滿足於AI僅僅對場景中一個感興趣目標進行分析
,而是希望機器對場景周遭環境具備一定的理解能力
,也就是希望機器能具備初步的認知智能能力
。
所謂認知智能 ,就是以人類認知體係為基礎 ,以感知信息的深度理解和自然語言信息的深度理解為主要研究方向的技術科學 。如圖1所示 ,對於安防行業來說 ,這兩個研究方向都有著非常直接的應用。
首先
,我們來看安防領域中感知信息深度理解的應用
,有別於AI1.0時代對人
、車
、物等特定目標的分析
,AI2.0在安防領域還有非常多泛監控場景應用
,比如在交通
、政法
、城管
、校園
、工地等場景下的人群態勢
、安全事件
、數據參量甚至衛生環境分析
。這些應用更多的強調了場景中目標與目標
、目標與周圍環境的相互關係
,因此需要人工智能具有一定的理解和辨識能力
,我們稱之為場景圖像理解
。一些典型的例子包括
:交通事件分析
,如行人穿越
、障礙物檢測
、非法停車等
;道路安全事件分析
,如淹水
、積雪
、大霧
、火焰等
;市域治理類事件分析
,如人員聚集
、占道經營
、亂丟垃圾
、黑煙車等等
。
通過使用傳統深度學習算法來完成這些泛安防的場景理解任務是非常困難的 ,由於這些場景的多樣性和任務的多變性 ,帶來了數據難以采集 、標注困難 、標注成本高 、算法泛化性能差 、魯棒性不足 ,算法交付時間長 、可擴展性差等諸多問題 。因此 ,AI1.0時代的感知智能算法難以用於場景的深度理解應用 。
另一個在安防領域中的認知智能方向 ,是基於自然語言信息的行業知識理解 。安防廠商向用戶提供的行業解決方案必須要深刻了解行業知識 ,傳統上這部分的行業知識是由自然語言的文字描述 ,並生成對應的知識圖譜來進行承載 。如公安知識圖譜 ,是通過數據分析 、文本語義分析等手段 ,抽取出公安應用中的人、物 、地 、機構 、虛擬身份等實體 ,並根據其中的屬性、時空 、語義 、特征 、位置聯係等建立相互關聯 ,構建一張多維多層的關係網絡 。又如司法的知識圖譜 ,則是將法律領域中的實體 、屬性和關係進行體係化梳理 ,並建立邏輯關聯 ,通過知識圖譜技術進行數據挖掘來輔助法律工作者更好地理解和應用法律知識 。安防廠商往往必須要掌握相關行業的知識圖譜 ,才能提供專業的行業解決方案 。
但是
,知識圖譜本身的構建與應用就有非常多的挑戰
,難以推廣
。首先
,需要建立高質量的知識圖譜構建模式
,需要定義清晰的實體和關係
,使用合適的數據源和知識表示方式
,這些工作都涉及到大量的人工經驗操作和判斷
;其次
,構建知識圖譜需要大規模自動化知識獲取
,知識圖譜需要大量的知識作為基礎
,隨著知識的日益複雜
,手工從知識來源中提取的方法滿足不了大規模的構建需求
;此外
,需要持續更新迭代知識圖譜
,知識本身不是封閉的
,而是在不斷的擴展和變化
,知識圖譜難以處理不完整或是動態變化的知識
。這些知識圖譜構建和應用的困難
,意味著需要找到一種新的讓機器理解知識的方法
。顯然
,這超出了感知智能的領域範疇
。
可見 ,對於認知智能在安防應用中的兩個深度理解方向 ,AI1.0的算法已經力不從心了 ,那麽我們的對策是什麽呢 ?這就是GPT大模型 。所謂GPT大模型 ,是指基於Transformer架構的(GPT的‘T’)生成模型(GPT的‘G’) ,是通過極大量的語料或者圖像進行預訓練(GPT的‘P’)的一個極大量參數的大模型(例如OpenAI的GPT-4大模型 ,有近萬億參數) 。蘇州科達經過努力研發 ,推出了適用於安防行業的KD-GPT ,其中包含了三類大模型 ,分別是 :多模態大模型 、行業大模型和AIGC圖像大模型 。
GPT作為生成式的AI模型有非常多的優點
,其中最基本的優點有以下2點
:首先
,大模型是多任務的
。以前的深度學習模型
,一個模型對應一個任務
,而現在大模型則是一個模型可以應對多個下遊任務
;其次
,得益於Transformer的結構特性
,大模型在本質上已經具備了信息的檢索和信息理解能力
,這也是傳統深度學習模型不具備的特征
。
KD-GPT的多模態大模型 ,以多種模態的信息為輸入 ,在模型內部將信息進行融合 ,可以解決所有數據難問題 。比如我們要檢測一幅圖片中是否有煙霧出現 ,我們隻要輸入提示語 :“煙霧”和待檢測的圖片 ,大模型就可以直接輸出檢測結果 ,而無需采集成千上萬張的煙霧圖片進行訓練 。同樣 ,如果替換文字輸入為“火焰”,則大模型無需專門的數據訓練就可以自動檢測圖片中是否出現火焰 。
KD-GPT的行業大模型采用了“通用大模型+行業數據+訓練調優”的思路
,使得這個大模型可以輕鬆解決原來構建行業知識圖譜需要完成的若幹任務
,在做好知識推理和質量評估之後
,行業大模型就可以完全替代行業知識圖譜的功能
。
科達的另一類大模型AIGC圖像大模型 ,還可以為人工智能算法生成大量的訓練數據 。
►
三 、AI3.0時代 :
未來的決策智能
從認知智能到決策智能 ,需要在數據 、學習 、多模態數據處理 、決策樹模型和個性化算法等方麵取得重要進展 。這些進展將會助力社會全智能化時代的到來 。
大模型是實現決策智能的重要工具之一 ,因為它們具有高效的數據處理能力和強大的特征工程能力 ,可以這麽說 ,有了大模型人們才真正看到了決策智能 ,看到了機器變為人工大腦的曙光 。
但是 ,我們也必須正視大模型還存在的若幹問題 :
1.公正性
大模型是建立在對大量數據的預訓練 ,以及不斷調整的提升訓練基礎之上的 ,如何才能保證大模型不被預訓練數據和提升帶偏 ?
要保證大模型的公正性就要求我們使用多個來源的數據進行預訓練 ,可以避免模型過於依賴某一類數據 ,從而提高模型的泛化能力 。同時對於選擇的訓練數據 ,需要投入人工進行清洗和標注 ,以保證數據的質量和可靠性 。
2.透明性
大模型本質上還是神經網絡 ,而神經網絡的透明性 、可解釋性仍然沒有得到有效解決 。如何對模型的決策過程進行評估和監督 ?
對於大模型和神經網絡這個難題 ,學術界一直在積極研究之中 ,如可以通過訓練一個輔助模型來評估主模型的性能 。如對大模型的每一層輸出進行細致的可視化分析 ,尋找其中的規律共性等等 。
3.普惠性
無論是訓練還是部署 ,大模型的成本都是很高的 ,對於像科達這樣的安防公司怎麽做大模型 ?對於科達不同體量的大小客戶 ,怎樣才能得到人人可用的大模型 ?
要想降低大模型的使用成本 ,對於每個企業和用戶單體來說 ,要考慮使用預訓練模型 、選擇合適的模型架構 、利用分布式計算等等 。更重要的是 ,政府 、企業和社會各方麵要協同合作 ,通過建設算力基礎設施 、打造算力服務平台、建立算力共享機製 、推進大模型技術研發和製定大模型鼓勵政策等多種方式 ,讓更多的人和企業能夠方便地獲取和使用大模型算力資源 ,這需要全社會的共同努力 。
4.友善性
如何避免大模型提供所謂的邪惡信息(如教唆犯罪) ,又如何保護人類的知識產權或是大模型的知識產權 ,不被其它大模型竊取和侵犯 ?
在設計和使用大模型時 ,我們首先應該遵循道德和法律規範 ,以避免對社會和個人造成不良後果 。當前 ,國家已經初步製定和出台了生成式AI相關法律和政策 ,規範生成式AI的研發和使用 ,限製大模型的使用範圍和方式 ,防止其被濫用和侵犯他人權益 ,確保其符合社會公共利益 。另一方麵 ,尊重和保護知識產權也是大模型發展的基礎 ,國家應該加強對大模型的知識產權保護 ,激勵創新和技術進步 。
綜上所述 ,雖然大模型的出現被稱之為AI的第二次革命 ,但在技術成熟度的曲線上 ,大模型到達成熟期還有很遠距離 。不僅如此 ,安防領域要實現真正的決策智能 ,大模型也不會是唯一的關鍵技術,還需要人工智能持續進行創新性發展 ,是一個任重道遠的征途 。
►
四 、結語
隨著科技的飛速發展 ,技術變革已經成為了推動安防行業進步的重要力量 。從模擬到數字 ,從標清到高清 ,從有線到5G ,從功能到智能 ,每一次技術變革都給安防行業帶來全新的巨大的增長 。可以預見 ,隨著技術的不斷發展 ,安防行業仍然具有充足的動力和廣闊的未來。我們應該積極擁抱包括人工智能在內的各項技術變革 ,充分利用新技術的優勢 ,提高安防工作的效率和質量 ,共同促進社會的和諧與穩定 。蘇州科達願與領域友商同行 ,以及上下遊企業一起努力 ,為安防行業的明天共同奮鬥 !