快速獲取三維(3D)建築數據,包括屋頂、高度和結構等幾何屬性,以及功能、質量和年齡等指标屬性,對于準确的城市分析、模拟和政策更新至關重要。當前的建築物數據集存在多維屬性時空覆蓋缺失。龍瀛課題組開發了一個用于大規模建築建模的人工智能框架(圖1),提出了第一個國家規模的多屬性建築物數據集CMAB,覆蓋了中國3667個實體城市,3100萬個建築和236億m2的屋頂,在基于OCRNet的提取中F1值為89.93%,總計3630億m3的建築存量。基于城市行政等級分類訓練了機器學習模型,包含形态、區位和功能等特征。使用多源數據,包括數10億張高分辨率遙感圖像和6000萬張街景圖像,通過深度學習、機器學習和多模态大模型為每棟建築生成了屋頂、高度、結構、功能、風格、年齡和質量屬性。準确性通過模型基準、現有的類似産品和人工檢查進行了驗證,準确率超過80%。數據集和結果對于全球可持續發展目标和城市規劃至關重要。
圖1. CMAB的整體建模框架
【研究背景】
在過去幾十年的城市化進程中,世界各地的城市經曆了快速擴張,建築物成為空間基本細胞單元,城市在三維形态和社會功能方面呈現出日益複雜的變化。通過構建數據集全面了解城市的精細三維物理和社會結構,對于研究城市化進程、城市能源、城市生态系統以及與碳排相關的政府決策至關重要。建築屬性可以大緻分為兩類:幾何屬性,包括建築二維形态、高度、結構和方位;和指标屬性,包括功能、風格、年齡、質量和空置。幾何屬性對于分析城市物理結構和規劃城市空間至關重要,而指标屬性是理解建築性能和生命周期的關鍵。
一方面,由于以往數據的空間和時間分辨率不足、訓練樣本有限以及訓練成本高昂,三維城市形态信息由于測繪成本和技術限制一直難以大規模展開,尤其是在發展中國家。因為傳統航空測量經濟成本高、時間長,使用開源數據快速提取三維建築數據是未來的發展趨勢。另一方面,目前對城市結構的理解仍主要停留在物理層面,以現有的建築屋頂和高度數據為代表,缺乏建築物的綜合社會屬性,如功能、風格、年齡和質量。據調查,CMAB是世界上第一個在建築單體層面提供這些屬性的國家規模的尺度開放建築物數據集。
圖2. 建築屬性和數據來源可視化
【主要解決問題】
1.空間抽樣策略
首先定義實體城市的邊界,以明确數據産品的提取範圍。根據中國的氣候區劃和行政城市級别選擇建築樣本,并将所有建築物按照其對應的行政級别分為五類。
圖4. 實體城市GES影像的時間分布
2.構建指标體系,提取三維建築
利用手工标注增強的屋頂樣本來訓練OCRNet模型,并采用空間聚合方法提取所有實體城市的建築屋頂。在此基礎上,計算不同尺度下的建築形态、密度和區位特征。針對每個行政級别的建築,訓練合适的分區模型以完成三維建築的提取。同時在建築高度的指标體系上加入建築功能特征。
圖6. 百度建築數據集的統計與預處理
3.提取指标屬性
使用多源數據進一步提取不同尺度下的功能特征,生成功能特征。通過結合長時序不透水面和6000萬條街景圖像,通過空間匹配和目标檢測為每個建築單體分配建築年代和質量。此外,建築的結構、風格屬性通過微調CLIP多模态模型獲得。
4.數據驗證
圖11. 建築物多屬性的人工驗證方法
【成效分析】
1. 數據産品整體介紹
圖12. 北京多屬性建築物數據集的可視化
2. 建築輪廓結果
評估基于一個驗證集,包含來自七個不同氣候區的城市中23,415個手動标注的建築屋頂。結果顯示,建築屋頂分割模型在相關數據集上的交并比(mIoU)、召回率(Recall)和精度(Precision)方面優于現有研究。在補充了114,783個建築單體的标注數據後,屋頂分割模型達到了91.59%的準确率,81.95%的 mIoU,89.93%的 F1 分數,以及79.86%的Kappa 系數。
3. 建築高度結果
通過可視化和高度分類和 GABLE 數據集進行了比較。GABLE 是一個通過光學影像識别中國所有建築高度的産品,提供了 0-10、10-30、30-50、50-100、100-500 米高度區間的 RMSE 值。根據這些區間分類數據後發現,在50米以下的區間内,表現出更低的 RMSE 值。根據使用的 Baidu 數據統計,98% 的建築高度低于50米。另外,根據2020年中國人口普查,超過10層的住宅建築(大緻相當于建築高度超過30米)僅占1%。
圖13. 與GABLE建築高度的可視化與比較
圖14. 分區模型和組合模型的相對誤差和絕對誤差值表示的不确定性
4. 建築功能結果
劃分模型的表現優于組合模型,住宅功能識别的精度更高,F1 分數接近 0.90。而其他功能類别,如辦公樓的識别精度略低,F1 分數接近 0.80。相比之下,商業和公共服務功能的模型表現較差,F1 分數約為 0.5。使用街景數據對2500 棟建築的功能進行了人工驗證,發現 88% 的建築功能分類是準确的。這表明方法能夠正确識别大多數建築的功能用途。
5. 建築質量和年代結果
各種建築質量類别的識别準确率如下:“外立面損壞的建築”(83.4%)、“非法/臨時建築”(71.6%)、“塗鴉/非法廣告”(80.7%)、“門面差的商店”(89.8%)、“外立面不整潔的建築”(79.9%)和“招牌差的商店”(84.6%)。建築年代的準确性則依賴于 GAIA 數據的精度。GAIA 各年份的平均總體準确率高于 90%。利用安居客的住房交易數據,其中包括 3771892 條房屋租賃,包含建築年份和坐标信息。發現在省級層面上,住房交易數據中的建築年代與估計值之間存在顯著正相關關系。與 GAIA 的建築年代數據相比,結果顯示平均差異為 8.7 年,GAIA 的建築年代通常比住房交易記錄的時間要早。使用街景通過人工審核對 2500 棟建築的質量和年代進行了手動标注,給建築質量問題分配了從 0 到 6 的嚴重程度評分。與現有結果進行相關性分析,得到了 R² 值為 0.78。關于建築年代,将手動标注的建築年代分為五個類别(1985、1990、2000、2010和 2018),并統計所識别的建築年代是否符合觀察到的真實類别值,發現 82% 的建築分類驗證是準确的。
6. 建築結構和風格結果
目前,大型多模态模型(LMMs)如 GPT-4o 等已經顯著改變了機器學習應用建模的範式。測試并微調了CLIP 和 GPT-4o等模型。比較深度學習和大模型訓練成本、精度差異和識别效率,發現LMMs 在推斷建築結構和風格方面表現良好(見圖 S9)。
圖16. 通過街景微調LMMs預測建築物屬性的準确性
【研究團隊介紹】
論文共同第一作者為beat365城市規劃系博士生張業成、博士生趙慧敏,beat365龍瀛教授為通訊作者。研究由國家自然科學基金重大項目(項目号:62394335和62394331)、面上項目(城市收縮背景下城市空置的智能測度、機理認知與規劃設計響應研究,項目号:52178044)和能源基金會項目(項目号:G-2306-34815)資助。
同時,龍瀛課題組已發布的相關數據集“全球1公裡網格人口數據集(2020-2100)”,關聯論文入選ESI高被引論文,論文共同第一作者為beat365城市規劃系博士生王新宇,beat365出站博士後、中國礦業大學講師孟祥鳳,beat365龍瀛教授為通訊作者。該數據集覆蓋全球248個國家或地區,其空間分辨率為30弧秒(約1公裡),間隔時間為5年。數據集同5個社會經濟共享路徑情景(Shared Socioeconomic Pathways, SSPs)相統一。通過與WorldPop數據集在省級層面和網格層面的比較得到驗證,可以作為各領域預測研究的輸入數據。成果于2022年9月在Scientific Data上以數據論文形式發布,目前數據浏覽量超過14200次,下載量超過13400次。
文章URL:
建築數據:https://www.nature.com/articles/s41597-025-04730-5
人口數據:https://www.nature.com/articles/s41597-022-01675-x
數據和代碼:
建築數據:https://doi.org/10.6084/m9.figshare.27992417
人口數據:https://doi.org/10.6084/m9.figshare.19608594