• 三維重建

    編輯
    本詞條由“匿名用戶” 建檔。

    三維重建

    編輯

    三維重建是指利用二維投影或影像恢復物體三維信息(形狀等)的數學過程和計算機技術

    形狀重建

    編輯
    • 自陰影重建形狀(英文:shape from shading)
    • 自邊界重建形狀(英文:shape from silhouette)

    深度學習的方法

    編輯

    概論

    因為三維的形狀比二維影像有更多資訊,因此直接從二維影像推測三維形狀對計算機而言并不是容易的工作,但對人類來說,對于生活中常見到的物體,我們常常可以從單一角度看,就可以推測經驗上物體的整個形狀(在三維空間中的樣子),人類之所以能做到這樣是因為長久經驗的累積,因此對于計算機而言,如果學習過夠多二維影像以及三維形狀的資訊,理論上也能夠做到,因此近來有不少利用深度學習的三維重建方法,利用大量的訓練資料(例如:影像以及相對應的三維形狀)來訓練深度神經網絡或是卷積神經網絡建構的模型,達到由單張或多張二維影像作為輸入,推測三維形狀。此外,有些大量三維模型的數據[1]也在近年被建立,以便于這些深度學習模型的訓練與相互比較的基礎。

    三維重建

    常用資料型態

    • 體素
    • 點云

    體素與點云的比較

    體素與二維的像素一樣,具有規律性的排列,可以直接套用卷積神經網絡,因此把現成處理二維影像的模型架構進行適當的修改,就能夠應用在三維重建的問題上。點云則是資料點的集合,沒有規律性的排列,因此無法套用卷積神經網絡,要使用其他的方法。不過體素相較于點云有一個很大的缺點就是龐大的記憶量與運算量,對于一個立體空間,我們所在意的物件可能占此空間的比例不大,其他部分都是空的,但體素還是要在空的地方儲存值為零。而點云只要記錄有物體所在的點的座標就好,因此比較節省內存與運算量(高分辨率下),也比較適合表示高分辨率的三維資料。

    不同類型的輸入二維資料類型

    • 使用二維RGB影像作為輸入
    • 使用深度圖做為輸入

    不同數量的輸入影像

    • 使用同一物件的單張影像作為輸入
    • 使用同一物件的多張影像(由不同視角所拍攝)作為輸入

    利用自編碼器

    TL網絡

    訓練時,先使用三維形狀的資料(以體素表示),訓練三維資料的自編碼器,接著在訓練一個的二維影像編碼器,這個影像編碼器的目的是讓二維影像編碼出來的向量與三維體素的自編碼器中利用相對應的三維體素編碼出來的向量越接近越好。測試時只有二維的影像,并不知道其三維的形狀。書入影像經由二維影像的編碼器,得到特征向量,再使用訓練好的三維體素的解碼器(即是自編碼器中的解碼器)即可得到此二維影像所對應的三維體素。

    利用生成對抗網絡

    三維生成對抗網絡

    生成對抗網絡常被用在二維影像的生成,但也可以用在三維形狀的生成(資料一樣以體素表示),采用一個二維影像的編碼器,一個三維體素的解碼器(即是生成對抗網絡中的生成器),還有一個生成對抗網絡的判別器。二維的影像被編碼成特征向量后,被三維體素的解碼器解碼,再由判別器來幫助生成三維形狀的品質。

    內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/112792/

    (7)
    詞條目錄
    1. 三維重建
    2. 形狀重建
    3. 深度學習的方法
    4. 概論
    5. 常用資料型態
    6. 體素與點云的比較
    7. 不同類型的輸入二維資料類型
    8. 不同數量的輸入影像
    9. 利用自編碼器
    10. TL網絡
    11. 利用生成對抗網絡
    12. 三維生成對抗網絡

    輕觸這里

    關閉目錄

    目錄
    91麻精品国产91久久久久