大量線上內容來訓練他們的系
Posted: Tue Dec 17, 2024 4:45 am
根據路透社報道,前 OpenAI 首席科學家 Ilya Sutskever 對資料訓練限制的警告震驚了技術市場。 Sutskever 在 NeurIPS 會議上發表講話,強調需要創新方法,例如人工智慧產生的數據和增強的推理能力,以推動人工智慧的發展。他預測,未來的人工智慧系統將擁有類似人類的推理能力,使其行為更難預測,因此需要改變人工智慧的發展策略。但其他專家認為,目前的方法仍有運作空間,這使得企業必須在如何評估和部署人工智慧系統的競爭願景中找到方向,這些系統為從詐欺檢測到庫存管理的一切提供支援。 McKesson 公司數據和技術營運高級經理 Arunkumar Thirunagalingam 告訴 PYMNTS,網路數據正在耗盡,人工智慧公司正在感受到壓力。
多年來,他們依靠抓取統。這在一段時間內起到了作用,但現在簡單的數據正在枯竭。這種轉變使擁有獨特資料來源(例如醫療記錄或物流資訊)的公司受到關注。這不再是你能取得多少數 選購 據的問題;而是你能獲得多少數據的問題。這是關於擁有正確類型的數據。即將到來的數據乾旱?人工智慧系統依賴來自互聯網的大量數據來訓練和改進。然而,高品質、多樣化的資料池是有限的,研究人員可能已接近可用資料的極限。隨著模型變得越來越大並且需要更多的輸入,重複利用類似資訊的風險也會增加,導致收益遞減。
此外,許多網路內容都是吵雜或重複的,降低了其對尖端培訓的有用性。這種稀缺性挑戰研究人員尋求替代方案,例如創建合成數據、利用專門的數據集或開發更少依賴原始數據而更多依賴高級推理能力的模型。蒂魯納加林加姆說,隨著需要抓取的網路數據越來越少,企業正在發揮創意。他們轉向物聯網設備和感測器等現實世界來源來收集新資訊。眾包平台付費讓人們分享他們獨特的見解,從而創造更多選擇。他補充說,這種轉變已經在農業領域掀起波瀾,人工智慧利用即時數據來提高農作物產量,在城市規劃領域,城市感測器幫助設計更智慧的基礎設施。
多年來,他們依靠抓取統。這在一段時間內起到了作用,但現在簡單的數據正在枯竭。這種轉變使擁有獨特資料來源(例如醫療記錄或物流資訊)的公司受到關注。這不再是你能取得多少數 選購 據的問題;而是你能獲得多少數據的問題。這是關於擁有正確類型的數據。即將到來的數據乾旱?人工智慧系統依賴來自互聯網的大量數據來訓練和改進。然而,高品質、多樣化的資料池是有限的,研究人員可能已接近可用資料的極限。隨著模型變得越來越大並且需要更多的輸入,重複利用類似資訊的風險也會增加,導致收益遞減。
此外,許多網路內容都是吵雜或重複的,降低了其對尖端培訓的有用性。這種稀缺性挑戰研究人員尋求替代方案,例如創建合成數據、利用專門的數據集或開發更少依賴原始數據而更多依賴高級推理能力的模型。蒂魯納加林加姆說,隨著需要抓取的網路數據越來越少,企業正在發揮創意。他們轉向物聯網設備和感測器等現實世界來源來收集新資訊。眾包平台付費讓人們分享他們獨特的見解,從而創造更多選擇。他補充說,這種轉變已經在農業領域掀起波瀾,人工智慧利用即時數據來提高農作物產量,在城市規劃領域,城市感測器幫助設計更智慧的基礎設施。