我們歡迎您!! …社團法人臺灣省土木技師公會…

技師報於85年11月18日土木日創刊
新聞局出版事業登記證局版省報字第48號


中華民國一一三年十二月十四日

廣告專線 :(02)8961-3968轉142
傳真:(02)2964-1159,2963-4076
地址:新北市板橋區三民路二段37號A3
網址:http://www.twce.org.tw
E-mail:mail@twce.org.tw

NO.

1462

發  行  人:洪啓德
社務委員:黃騰輝、陳玫英、伍勝民、黃武龍、陳錦芳、周子劍、蔡震邦
     林景棋、拱祥生、呂震世、謝祥樹、楊高雄、高 原、杜明星
監  察  人:施義芳、陳清展、鄭明昌、陳菁雲、巫垂晃
社  長:陳玫英

副  社  長:黃騰輝、拱祥生

總  編  輯:楊耀昇

副  總  編:朱煌林
營運總監:伍勝民

總  主  筆:周子劍
本期主筆:拱祥生
執行編撰:李惠華
文字記者:許素梅

[AI時代土木技師的專業助理] 系統倡議

- Co-Professional Engr.,一個基於 Android iTunes 平台的 API 調用核心智能助理

 梁禮麟 土木技師/美國德州大學奧斯汀分校營建管理博士

引言

在現代土木工程的世界裡,專業技師和工程師們經常需要查詢大量的技術資料、規範以及專家建議。然而,這些資訊分散在各種資料庫、PDF 文件和網站中,查詢起來既耗時又不便。當工程議題迫在眉睫時,低效的資料檢索不僅增加了專案延誤的風險,還可能因決策失誤而影響人員安全或公共利益。為了解決這些問題,筆者擬在公會群結合團隊提出打造一個全方位智慧資訊助理的願景。

願景

我們的目標是創建一個全方位的 AI 智慧資訊助理,為專業技師和工程師提供即時且精準的資訊查詢,提升工作效率和決策品質。這款應用程式將結合多元資料庫整合與大型語言模型(LLM)技術,革新專業人士獲取資訊的方式。

透過不斷更新和整合各類資料庫,我們確保資料的安全性與穩定性,並統一資料格式以提升檢索效率。運用自然語言處理(NLP)技術,我們將各種文件(如 PDFHTML 等)轉換為結構化資料,並透過嵌入式向量技術實現語意檢索和智慧匹配。

此外,系統將採用先進的語意搜尋和向量檢索技術,確保搜尋結果的精準度和相關性。這項創新將使工程師能夠迅速取得相關規範、文獻、案例和建議,大幅縮短查詢時間,使專案決策更加迅速、準確。

為了實現上述目標,我們將重點開發以下三大功能:

一、資料處理與嵌入技術

在資料處理階段,我們將整合三大資料庫的內容:

1. 台灣省土木技師公會專家知識庫[友會提供刊物或技術文獻]:使用這些專家知識資料,關鍵在於原作者或權利人所授權同意的範圍(Scope of Consent)。即使取得了部分同意,也需要確認該同意是否涵蓋了本計畫中的所有用途,特別是用於訓練AI 模型等可能超出原授權範圍的應用。

2. 台灣省土木技師公會技師報:這些已公開的資料包括多份PDFHTML格式的技術文章、報告及相關資訊,即使這些資料已公開發表,但著作權仍然屬於原作者或發行單位。公開發表並不等同於放棄著作權,也不代表他人可以自由使用於任何目的。第三方可以在合理使用範圍內引用公開發表的作品,前提是正確標註來源。然而,將這些資料用於訓練AI模型,可能超出合理使用的範疇,因為這涉及對作品的大量複製和潛在的商業應用。因此,將公開發表的資料用於訓練AI模型或其他再利用,需要與台灣省土木技師公會進行深入的洽談,取得明確的授權。

3. 台灣土木工程相關規範:如《建築技術規則》及鋼筋混凝土、鋼結構規範等。此為公開之規範資料,使用或重製並無任何限制,惟需注意在資料重整過程中,AI不能產生幻覺,把規範做錯誤的解讀和輸出。

我們取得授權之後,將使用文本抽取工具,將各種數位檔案格式的資料轉換為可編輯的文本內容,並進行資料清洗,去除水印、頁碼等無關資訊,確保資料的準確性和一致性。

為了提升後續檢索效率,我們將對整合後的文本進行標註,將章節名稱、標題、關鍵詞及圖表說明等關鍵資訊加以標記。這將為精確的內容檢索與深入理解奠定堅實的基礎。

二、大型語言模型(LLM)的整合

隨著人工智慧和深度學習的迅速發展,大型語言模型(LLM)應運而生。LLM 是一種基於深度學習的 AI 模型,能夠理解並生成類似人類語言的文本。透過學習海量的語言資料,這些模型掌握了語言的結構和語意,能夠執行回答問題、翻譯、撰寫文章等多種任務。

LLM 近期大量出現的原因在於深度學習技術的突破和硬體計算能力的提升。隨著高性能計算設備(如 GPU)的普及,訓練大型模型變得更加可行。此外,活躍的開源社群和豐富的資料集也為模型的訓練提供了堅實的基礎。

  1. OpenAI ChatGPT

ChatGPT 是目前商業化程度最高的LLM之一。它能夠理解複雜的語言輸入,提供詳細且準確的回答,應用範圍廣泛,包括問答系統、內容生成、輔助寫作等。活躍的開發者社群提供了豐富的文件和範例,方便整合和二次開發。然而,其使用成本較高,特別是在大規模應用時;同時,為了符合隱私法規,需要確保傳輸的資料不涉及敏感資訊。

  1. Google Gemini

GeminiGoogle推出的新一代LLM。依據Google的技術實力,該模型的性能可能優於同類產品,並能與Google的其他服務(如雲端平台、資料分析工具)無縫整合。然而,作為一款新產品,可能尚未完全商業化,API 訪問可能受到限制,相關的開發者支援和文件尚待充實與完善。

LLM 之效益

在本專案中,整合 LLM 將帶來顯著的效益:

  • 智能問答功能:能夠理解工程師的自然語言提問,從資料庫中檢索相關資訊,並生成專業的回答。

  • 內容摘要功能:可將冗長的技術文件或報告進行簡化,方便使用者迅速掌握重點。

  • 快速定位與解釋:能快速定位並解釋相關的技術規範和標準條款,提高工作效率。

  • 錯誤檢查:協助檢查工程計算或報告中的可能錯誤或不一致之處,降低潛在風險。

LLM 整合流程在土木工程應用中的實施

將大型語言模型(LLM)整合到土木工程應用中,需要精心設計的流程以確保其準確性、可靠性和效率。以下內容概述了整合過程中的關鍵步驟,重點介紹了API互動、模型微調以及資訊驗證機制。

  1. API 調用

為了實現與LLM的無縫通信,系統規劃採用安全的API介面。這不僅確保了資料交換的效率,還維護了資訊的隱私和安全。透過精心設計有效的提示(Prompt),我們提高了LLM回應的相關性和精確度,確保輸出內容能夠滿足土木工程專業人員的具體需求。

  1. 模型微調

預計在Phase2執行,將利用土木工程領域的專業資料對LLM進行了微調。此過程將增強模型對行業特定術語和概念的理解能力,使其能夠對複雜的工程問題提供更準確和深入的解答。微調後的模型更貼近行業標準和實踐,為使用者提供專業可信的支持。此Phase2及模型微調功能應屬商業階段項目,使用AI模型需付費。

  1. 資訊驗證機制

鑑於LLM可能偶爾產生不準確的資訊或所謂的「幻覺」,我們實施了健全的資訊驗證機制。

  自動檢測:我們引入了自動檢測工具,能夠迅速識別LLM輸出中的潛在錯誤。這些工具在第一時間標記異常,防止錯誤資訊的傳播。

  人工審核:對於關鍵或複雜的資訊,我們提供人工審核服務(需預先取得資格)。專業人員對內容進行仔細驗證,確保最終輸出的資訊準確可靠。此額外的驗證,應類比公會的複審制度,酌予收取合理費用。

透過結合自動化和人工的驗證過程,我們降低了錯誤輸出的風險,確保使用者獲得可信賴和精確的資訊。

三、先進的搜尋演算法

先進的搜尋演算法利用最新的自然語言處理和機器學習技術,超越傳統關鍵字匹配的搜尋方式,能夠理解文本的語意和上下文,提供更準確和相關的搜尋結果。

  • 語意搜尋

傳統搜尋主要依賴關鍵字的匹配,無法理解詞語的真正含義。進階的語意搜尋則能夠理解使用者查詢的意圖,根據語意相似度檢索相關內容。例如,使用者搜尋「混凝土強度計算方法」,語意搜尋能夠找到與「混凝土強度評估」、「混凝土抗壓強度計算」相關的內容,而不僅僅是包含關鍵字的結果。

  • 向量化檢索技術

進階的搜尋演算法採用了向量化檢索技術,將文本轉換為數學向量,利用向量間的距離衡量文本的相似度。其優勢在於能高效處理大量資料,支持即時檢索,並能考慮上下文,提供更加精準的結果。

此外,系統還具備以下能力:

  • 錯別字與同義詞處理

即使使用者輸入錯別字,系統也能透過識別同義詞,擴大搜尋範圍,確保搜尋結果的精準性與全面性。

  • 上下文理解

能夠根據使用者的連續查詢,推測其關注點,提供更貼合需求的搜尋結果。

結語

AI 時代土木技師的專業助理」應用,旨在為專業技師和土木工程師提供高效、便捷的資訊查詢與智能助理服務。透過整合多個專業資料庫、採用先進的搜尋演算法和大型語言模型技術,我們將大幅提升專業人員的工作效率,減少資訊查詢的時間和成本。

筆者建議在公會群間組織團隊誠摯地邀請有志之士共同參與這一創新計畫。您的資源與支持將是推動這項專案早日完成的關鍵。讓我們攜手合作,共同推動土木技師專業與工程營建的宏大進步與發展! 

 

返回上一畫面

    Top   Back