Unity3D 骨骼動(dòng)畫原理小記
2019/2/14??????點(diǎn)擊:
一、骨骼動(dòng)畫、關(guān)節(jié)動(dòng)畫、關(guān)鍵幀動(dòng)畫
在實(shí)際的游戲中,用得較多的是這三種基本的動(dòng)畫。
骨骼動(dòng)畫是進(jìn)一步的動(dòng)畫類型,原理構(gòu)成很其簡(jiǎn)單,但是解決問題很其有優(yōu)勢(shì)。將模型分為骨骼Bone和蒙皮Mesh兩個(gè)部分,其基本的原理可以闡述為:模型的骨骼可分為基本多層父子骨骼,在動(dòng)畫關(guān)鍵幀數(shù)據(jù)的驅(qū)動(dòng)下,計(jì)算出各個(gè)父子骨骼的位置,基于骨骼的控制通過頂點(diǎn)混合動(dòng)態(tài)計(jì)算出蒙皮網(wǎng)格的頂點(diǎn)。在骨骼動(dòng)畫中,通常包含的是骨骼層次數(shù)據(jù),網(wǎng)格Mesh數(shù)據(jù), 網(wǎng)格蒙皮數(shù)據(jù)Skin Info和骨骼的動(dòng)畫關(guān)鍵幀數(shù)據(jù)。
一、骨骼動(dòng)畫、關(guān)節(jié)動(dòng)畫、關(guān)鍵幀動(dòng)畫
在實(shí)際的游戲中,用得多的是這三種基本的動(dòng)畫。
在關(guān)鍵幀動(dòng)畫中,模型在每個(gè)關(guān)鍵幀中都是一個(gè)固定的姿勢(shì),相當(dāng)于一個(gè)“快照”,通過在不同的關(guān)鍵幀中進(jìn)行插值平滑計(jì)算,可以得到一個(gè)較為流暢的動(dòng)畫表現(xiàn)。關(guān)鍵幀動(dòng)畫的一個(gè)優(yōu)勢(shì)是只需要做插值計(jì)算,相對(duì)于其他的動(dòng)畫計(jì)算量很小,但是劣勢(shì)也比較明顯,基于固定的“快照”進(jìn)行插值計(jì)算,表現(xiàn)大大被限制,同時(shí)插值如果不夠平滑容易出現(xiàn)尖刺等現(xiàn)象。
關(guān)節(jié)動(dòng)畫是早期出現(xiàn)的一種動(dòng)畫,在這種動(dòng)畫中,模型整體不是一個(gè)Mesh, 而是分為多個(gè)Mesh,通過父子的關(guān)系進(jìn)行組織,這樣父節(jié)點(diǎn)的Mesh就會(huì)帶動(dòng)子節(jié)點(diǎn)的Mesh進(jìn)行變換,這樣層層的變換關(guān)系,就可以得到各個(gè)子Mesh在不同關(guān)鍵幀中的位置。關(guān)節(jié)動(dòng)畫相比于關(guān)鍵幀動(dòng)畫,依賴于各個(gè)關(guān)鍵幀的動(dòng)畫數(shù)據(jù),可以實(shí)時(shí)的計(jì)算出各個(gè)Mesh的位置,不再受限于固定的位置,但是由于是分散的各個(gè)Mesh,這樣在不同Mesh的結(jié)合處容易出現(xiàn)裂縫。
骨骼動(dòng)畫是進(jìn)一步的動(dòng)畫類型,原理構(gòu)成很其簡(jiǎn)單,但是解決問題很其有優(yōu)勢(shì)。將模型分為骨骼Bone和蒙皮Mesh兩個(gè)部分,其基本的原理可以闡述為:模型的骨骼可分為基本多層父子骨骼,在動(dòng)畫關(guān)鍵幀數(shù)據(jù)的驅(qū)動(dòng)下,計(jì)算出各個(gè)父子骨骼的位置,基于骨骼的控制通過頂點(diǎn)混合動(dòng)態(tài)計(jì)算出蒙皮網(wǎng)格的頂點(diǎn)。在骨骼動(dòng)畫中,通常包含的是骨骼層次數(shù)據(jù),網(wǎng)格Mesh數(shù)據(jù), 網(wǎng)格蒙皮數(shù)據(jù)Skin Info和骨骼的動(dòng)畫關(guān)鍵幀數(shù)據(jù)。
在前面,我們已經(jīng)提到,頂點(diǎn)需要依附于骨骼進(jìn)行位置計(jì)算,但是建模的時(shí)候,頂點(diǎn)的位置是基于Mesh原點(diǎn)進(jìn)行建模的,通常情況下,Mesh的原點(diǎn)是和模型的骨骼的根骨骼處于同一個(gè)坐標(biāo)空間中,那么 BoneOffsetMatrix就是用來將Mesh中頂點(diǎn)從Mesh空間轉(zhuǎn)換到骨骼所在空間中。
在建模的時(shí)候,對(duì)于每個(gè)骨骼,我們是可以得到其對(duì)應(yīng)的Transform Matrix(用來層層計(jì)算到父節(jié)點(diǎn)所在空間中),其中根骨骼的Transform Matrix是基于世界空間的轉(zhuǎn)換,所以對(duì)于每一個(gè)下面的子骨骼,要計(jì)算其Transform Matrix,需要進(jìn)行一個(gè)矩陣的連乘操作。*后得到的*終矩陣連乘結(jié)果矩陣就是Combined Transform Matrix,基于這個(gè)矩陣,就可以將頂點(diǎn)從骨骼所在的空間轉(zhuǎn)換到世界空間中。反過來,這個(gè)矩陣的逆矩陣(一般只考慮可以取逆的操作),就是從世界空間中轉(zhuǎn)換到該骨骼的空間中,由于Mesh的定義基于Mesh原點(diǎn),Mesh原點(diǎn)就在世界空間中,所以這個(gè)逆矩陣就是要求的 Offset Matrix,也被稱為Inverse Matrix,這個(gè)逆矩陣一般實(shí)在初始位置中求得,通過取逆即可獲得。
在實(shí)際的計(jì)算中,每個(gè)骨骼可能會(huì)對(duì)應(yīng)多個(gè)頂點(diǎn),如果每個(gè)頂點(diǎn)都保存其對(duì)應(yīng)的骨骼的變換矩陣,那么大量的頂點(diǎn)就會(huì)報(bào)錯(cuò)比較多的變換矩陣。所以我們只需要保存當(dāng)前該骨骼在初始位置,對(duì)應(yīng)的從世界空間到其骨骼空間的變換矩陣,那么其對(duì)應(yīng)的每個(gè)頂點(diǎn)在每次變換操作的時(shí)候,只需要對(duì)應(yīng)的用offset Matrix來操作即可。
對(duì)于上面的Transform Matrix和offset Matrix,是納入了旋轉(zhuǎn)、平移和縮放的。其實(shí)offset Matrix取決于骨骼的初始位置,此時(shí)一般只包含了平移(此時(shí)還沒有動(dòng)畫,所以沒有旋轉(zhuǎn)和縮放),在動(dòng)畫中,一般也以縮放為主(所以大部分的動(dòng)畫的關(guān)鍵幀用四元數(shù)表示)。在矩陣中都包含,是處于兼容性考慮。
這兒就基于平移,做一個(gè)基本的蒙皮的計(jì)算過程:
三、Unity3D骨骼動(dòng)畫處理
前面講解的對(duì)于骨骼動(dòng)畫中的骨骼變換,蒙皮的計(jì)算,都是在CPU中進(jìn)行的。在實(shí)際的游戲引擎中,這些都是分開處理的,較為通用的處理是將骨骼的動(dòng)畫數(shù)據(jù)驅(qū)動(dòng)放在CPU中,計(jì)算出骨骼的變換矩陣,然后傳遞給GPU中進(jìn)行蒙皮計(jì)算。在DX10的時(shí)候,一般的shader給出的寄存器的大小在128的大小,一個(gè)變換矩陣為4x4,如果去除*后一行(0,0,0,1)就可以用3個(gè)float表示,那么*多可以表示,嗯,42個(gè)左右,如果考慮進(jìn)行性能優(yōu)化,不完全占用寄存器的大小,那么一般會(huì)限制在30根骨骼的大小上。將這些骨骼的變換矩陣在CPU進(jìn)行計(jì)算后,就可以封裝成skin info傳遞到GPU中。
在GPU的計(jì)算中,就會(huì)取出這些mesh上的頂點(diǎn)進(jìn)行對(duì)應(yīng)的位置計(jì)算,基于骨骼的轉(zhuǎn)換矩陣和骨骼的權(quán)重,得到*新的位置,從而進(jìn)行一次頂點(diǎn)計(jì)算和描繪。之所以將骨骼動(dòng)畫的兩個(gè)部分分開處理,一個(gè)原因就是CPU的處理能力相對(duì)而言沒有GPU快捷,一般一個(gè)模型的骨骼數(shù)量是較小的,但是mesh上的頂點(diǎn)數(shù)量較大,利用GPU的并行處理能力優(yōu)勢(shì),可以分擔(dān)CPU的計(jì)算壓力。
在DX11還是DX12之后(記不太清楚),骨骼變換矩陣的計(jì)算結(jié)果不再存儲(chǔ)在寄存器中,而是存儲(chǔ)在一個(gè)buffer中,這樣的buffer大小基于骨骼數(shù)量的大小在第一次計(jì)算的時(shí)候設(shè)定,之后每次骨骼動(dòng)畫數(shù)據(jù)驅(qū)動(dòng)得到新的變換矩陣,就依次更改對(duì)應(yīng)的buffer中存儲(chǔ)的變換矩陣,這樣就不再受到寄存器的大小而限制骨骼的根數(shù)的大小。但是實(shí)際的優(yōu)化中,都會(huì)盡量?jī)?yōu)化模型的骨骼的數(shù)量,畢竟數(shù)量越多,*是影響頂點(diǎn)的骨骼數(shù)量越多,那么計(jì)算量就會(huì)越大,正常的思維是優(yōu)化骨骼數(shù)量而不是去擴(kuò)展buffer的大?。篋
在文章2中,對(duì)于GPU的蒙皮計(jì)算做了較大的性能優(yōu)化,主要的思維也是這樣,在CPU中進(jìn)行骨骼變換,將變換的結(jié)果傳遞到GPU中,從而進(jìn)行蒙皮計(jì)算。基本的思維和前面說的變換思維一致,其基本的優(yōu)化重點(diǎn)也是想利用一個(gè)buffer來緩存變換矩陣,從而優(yōu)化性能。這兒我就重點(diǎn)分析一下shader部分的代碼,其在cpu部分的代碼處理基本和前面的代碼思想一致:
如果采用CPU的計(jì)算骨骼變換,那么GPU的shader:
在實(shí)際的游戲中,用得較多的是這三種基本的動(dòng)畫。
在關(guān)鍵幀動(dòng)畫中,模型在每個(gè)關(guān)鍵幀中都是一個(gè)固定的姿勢(shì),相當(dāng)于一個(gè)“快照”,通過在不同的關(guān)鍵幀中進(jìn)行插值平滑計(jì)算,可以得到一個(gè)較為流暢的動(dòng)畫表現(xiàn)。關(guān)鍵幀動(dòng)畫的一個(gè)優(yōu)勢(shì)是只需要做插值計(jì)算,相對(duì)于其他的動(dòng)畫計(jì)算量很小,但是劣勢(shì)也比較明顯,基于固定的“快照”進(jìn)行插值計(jì)算,表現(xiàn)大大被限制,同時(shí)插值如果不夠平滑容易出現(xiàn)尖刺等現(xiàn)象。
關(guān)節(jié)動(dòng)畫是早期出現(xiàn)的一種動(dòng)畫,在這種動(dòng)畫中,模型整體不是一個(gè)Mesh, 而是分為多個(gè)Mesh,通過父子的關(guān)系進(jìn)行組織,這樣父節(jié)點(diǎn)的Mesh就會(huì)帶動(dòng)子節(jié)點(diǎn)的Mesh進(jìn)行變換,這樣層層的變換關(guān)系,就可以得到各個(gè)子Mesh在不同關(guān)鍵幀中的位置。關(guān)節(jié)動(dòng)畫相比于關(guān)鍵幀動(dòng)畫,依賴于各個(gè)關(guān)鍵幀的動(dòng)畫數(shù)據(jù),可以實(shí)時(shí)的計(jì)算出各個(gè)Mesh的位置,不再受限于固定的位置,但是由于是分散的各個(gè)Mesh,這樣在不同Mesh的結(jié)合處容易出現(xiàn)裂縫。骨骼動(dòng)畫是進(jìn)一步的動(dòng)畫類型,原理構(gòu)成很其簡(jiǎn)單,但是解決問題很其有優(yōu)勢(shì)。將模型分為骨骼Bone和蒙皮Mesh兩個(gè)部分,其基本的原理可以闡述為:模型的骨骼可分為基本多層父子骨骼,在動(dòng)畫關(guān)鍵幀數(shù)據(jù)的驅(qū)動(dòng)下,計(jì)算出各個(gè)父子骨骼的位置,基于骨骼的控制通過頂點(diǎn)混合動(dòng)態(tài)計(jì)算出蒙皮網(wǎng)格的頂點(diǎn)。在骨骼動(dòng)畫中,通常包含的是骨骼層次數(shù)據(jù),網(wǎng)格Mesh數(shù)據(jù), 網(wǎng)格蒙皮數(shù)據(jù)Skin Info和骨骼的動(dòng)畫關(guān)鍵幀數(shù)據(jù)。
一、骨骼動(dòng)畫、關(guān)節(jié)動(dòng)畫、關(guān)鍵幀動(dòng)畫
在實(shí)際的游戲中,用得多的是這三種基本的動(dòng)畫。
在關(guān)鍵幀動(dòng)畫中,模型在每個(gè)關(guān)鍵幀中都是一個(gè)固定的姿勢(shì),相當(dāng)于一個(gè)“快照”,通過在不同的關(guān)鍵幀中進(jìn)行插值平滑計(jì)算,可以得到一個(gè)較為流暢的動(dòng)畫表現(xiàn)。關(guān)鍵幀動(dòng)畫的一個(gè)優(yōu)勢(shì)是只需要做插值計(jì)算,相對(duì)于其他的動(dòng)畫計(jì)算量很小,但是劣勢(shì)也比較明顯,基于固定的“快照”進(jìn)行插值計(jì)算,表現(xiàn)大大被限制,同時(shí)插值如果不夠平滑容易出現(xiàn)尖刺等現(xiàn)象。
關(guān)節(jié)動(dòng)畫是早期出現(xiàn)的一種動(dòng)畫,在這種動(dòng)畫中,模型整體不是一個(gè)Mesh, 而是分為多個(gè)Mesh,通過父子的關(guān)系進(jìn)行組織,這樣父節(jié)點(diǎn)的Mesh就會(huì)帶動(dòng)子節(jié)點(diǎn)的Mesh進(jìn)行變換,這樣層層的變換關(guān)系,就可以得到各個(gè)子Mesh在不同關(guān)鍵幀中的位置。關(guān)節(jié)動(dòng)畫相比于關(guān)鍵幀動(dòng)畫,依賴于各個(gè)關(guān)鍵幀的動(dòng)畫數(shù)據(jù),可以實(shí)時(shí)的計(jì)算出各個(gè)Mesh的位置,不再受限于固定的位置,但是由于是分散的各個(gè)Mesh,這樣在不同Mesh的結(jié)合處容易出現(xiàn)裂縫。
骨骼動(dòng)畫是進(jìn)一步的動(dòng)畫類型,原理構(gòu)成很其簡(jiǎn)單,但是解決問題很其有優(yōu)勢(shì)。將模型分為骨骼Bone和蒙皮Mesh兩個(gè)部分,其基本的原理可以闡述為:模型的骨骼可分為基本多層父子骨骼,在動(dòng)畫關(guān)鍵幀數(shù)據(jù)的驅(qū)動(dòng)下,計(jì)算出各個(gè)父子骨骼的位置,基于骨骼的控制通過頂點(diǎn)混合動(dòng)態(tài)計(jì)算出蒙皮網(wǎng)格的頂點(diǎn)。在骨骼動(dòng)畫中,通常包含的是骨骼層次數(shù)據(jù),網(wǎng)格Mesh數(shù)據(jù), 網(wǎng)格蒙皮數(shù)據(jù)Skin Info和骨骼的動(dòng)畫關(guān)鍵幀數(shù)據(jù)。
class Bone { Bone* m_pFirstChild; Bone* m_pSibling; float m_x, m_y, m_z; // pos in parents' space float m_wx, m_wy, m_wz; // pos in world space // public: Bone(float x, float y, float z): m_pSibling(NULL),m_pFirstChild(NULL),m_pFather(NULL),m_x(x), m_y(y), m_z(z){} // void SetFirstChild(Bone* pChild) { m_pFirstChild = pChild; m_pFirstChild->m_pFather = this; } // void SetSibling(Bone* pSibling) { m_pSibling = pSibling; m_pSibling->m_pFather = m_pFather; } }這樣,當(dāng)父節(jié)點(diǎn)骨骼發(fā)生變換的時(shí)候,子節(jié)點(diǎn)的骨骼就會(huì)做相應(yīng)的變換,這樣的操作可以稱為 UpdateBoneMatrix,這樣的操作可以用一個(gè)方法ComputeWorldPos來表示,這樣可以用遞歸的方式在Bone中實(shí)現(xiàn):
class Bone { void ComputeWorldPos(float fatherX, float fatherY, float fatherZ) { m_wx = fatherX + m_x; m_wy = fatherY + m_y; m_wz = fatherZ + m_z; //兄弟節(jié)點(diǎn)用父節(jié)點(diǎn)傳遞的參數(shù) if(m_pSibling !=NULL) m_pSibling ->ComputeWorldPos(fatherX, fatherY, fatherZ) if(m_pFirstChild!=NULL) m_pFirstChild ->ComputeWorldPos(m_wx, m_wy, m_wz) } }這樣,當(dāng)父節(jié)點(diǎn)骨骼發(fā)生變換的時(shí)候,子節(jié)點(diǎn)的骨骼都會(huì)做出相應(yīng)的變換,從而得到新的位置、朝向等信息,骨骼發(fā)生變化,從而會(huì)帶動(dòng)外在的mesh發(fā)生變化,所以整體的模型就表現(xiàn)chu出運(yùn)動(dòng)起來?;诖耍梢岳斫鉃槭裁垂趋朗枪趋绖?dòng)畫的核心。
#define MAX_BONE_VERTEX 4 class Vertex { float m_x, m_y, m_z; // local pos in mesh space float m_wx, m_wy, m_wz; // pos in world space //skin info int m_boneNum; Bone* m_bones[MAX_BONE_VERTEX]; float m_boneWeights[MAX_BONE_VERTEX]; }當(dāng)然,這兒只是一個(gè)簡(jiǎn)單的表述,具體的在引擎中會(huì)有規(guī)范的設(shè)計(jì)。那么我們的頂點(diǎn)在跟隨骨骼做運(yùn)動(dòng)的時(shí)候,是如何計(jì)算自己的位置的?我們就需要引入BoneOffsetMatrix 和 Transform Matrix的概念。
在前面,我們已經(jīng)提到,頂點(diǎn)需要依附于骨骼進(jìn)行位置計(jì)算,但是建模的時(shí)候,頂點(diǎn)的位置是基于Mesh原點(diǎn)進(jìn)行建模的,通常情況下,Mesh的原點(diǎn)是和模型的骨骼的根骨骼處于同一個(gè)坐標(biāo)空間中,那么 BoneOffsetMatrix就是用來將Mesh中頂點(diǎn)從Mesh空間轉(zhuǎn)換到骨骼所在空間中。
在建模的時(shí)候,對(duì)于每個(gè)骨骼,我們是可以得到其對(duì)應(yīng)的Transform Matrix(用來層層計(jì)算到父節(jié)點(diǎn)所在空間中),其中根骨骼的Transform Matrix是基于世界空間的轉(zhuǎn)換,所以對(duì)于每一個(gè)下面的子骨骼,要計(jì)算其Transform Matrix,需要進(jìn)行一個(gè)矩陣的連乘操作。*后得到的*終矩陣連乘結(jié)果矩陣就是Combined Transform Matrix,基于這個(gè)矩陣,就可以將頂點(diǎn)從骨骼所在的空間轉(zhuǎn)換到世界空間中。反過來,這個(gè)矩陣的逆矩陣(一般只考慮可以取逆的操作),就是從世界空間中轉(zhuǎn)換到該骨骼的空間中,由于Mesh的定義基于Mesh原點(diǎn),Mesh原點(diǎn)就在世界空間中,所以這個(gè)逆矩陣就是要求的 Offset Matrix,也被稱為Inverse Matrix,這個(gè)逆矩陣一般實(shí)在初始位置中求得,通過取逆即可獲得。
在實(shí)際的計(jì)算中,每個(gè)骨骼可能會(huì)對(duì)應(yīng)多個(gè)頂點(diǎn),如果每個(gè)頂點(diǎn)都保存其對(duì)應(yīng)的骨骼的變換矩陣,那么大量的頂點(diǎn)就會(huì)報(bào)錯(cuò)比較多的變換矩陣。所以我們只需要保存當(dāng)前該骨骼在初始位置,對(duì)應(yīng)的從世界空間到其骨骼空間的變換矩陣,那么其對(duì)應(yīng)的每個(gè)頂點(diǎn)在每次變換操作的時(shí)候,只需要對(duì)應(yīng)的用offset Matrix來操作即可。
對(duì)于上面的Transform Matrix和offset Matrix,是納入了旋轉(zhuǎn)、平移和縮放的。其實(shí)offset Matrix取決于骨骼的初始位置,此時(shí)一般只包含了平移(此時(shí)還沒有動(dòng)畫,所以沒有旋轉(zhuǎn)和縮放),在動(dòng)畫中,一般也以縮放為主(所以大部分的動(dòng)畫的關(guān)鍵幀用四元數(shù)表示)。在矩陣中都包含,是處于兼容性考慮。
這兒就基于平移,做一個(gè)基本的蒙皮的計(jì)算過程:
class BoneOffset { public: float m_offx, m_offy, m_offz; //暫時(shí)只考慮平移 } class Bone { public : BoneOffset* m_boneOffset; // void ComputeBoneOffset() { m_boneOffset.m_offx -= m_wx; m_boneOffset.m_offy -= m_wy; m_boneOffset.m_offz -= m_wz; if(m_pSibling != NULL) m_pSibling->ComputeBoneOffset(); if(m_pFirstChild !=NULL) m_pFirstChild->ComputeBoneOffset(); } } //頂點(diǎn)類的計(jì)算 class Vertex { public: void ComputeWorldPosByBone(Bone* pBone, float &outX, float& outy, float& outz) { //從mesh空間轉(zhuǎn)換到bone空間 outx = m_x + pBone->m_boneOffset.m_offx; outy = m_y + pBone->m_boneOffset.m_offy; outz = m_z + pBone->m_boneOffset.m_offz; //從bone空間轉(zhuǎn)換到世界空間 outx += pBone->m_wx; outy += pBone->m_wy; outz += pBone->m_wz; } //GPU中計(jì)算頂點(diǎn)的位置 void BlendVertex() { float m_wx = 0; float m_wy = 0; float m_wz = 0; for(int i=0; i < m_boneNum; i++) { float tx, ty,tz; ComputeWorldPosByBone(m_bones[i], tx, ty,tz); tx *= m_boneWeights[i]; ty *= m_boneWeights[i]; tz *= m_boneWeights[i]; m_wx += tx; m_wy += ty; m_wz += tz; } } }仔細(xì)捋一捋上面的代碼,就可以理解整體的蒙皮變換的過程,當(dāng)然,這兒只用了矩陣變換中的平移變換,如果考慮加上旋轉(zhuǎn)和縮放,則回到*初的計(jì)算公式中了。至此,對(duì)于基本的骨骼動(dòng)畫中的骨骼變換和蒙皮變換,有了一個(gè)詳細(xì)的解釋。下面說說Unity中是如何處理骨骼變換的。
三、Unity3D骨骼動(dòng)畫處理
前面講解的對(duì)于骨骼動(dòng)畫中的骨骼變換,蒙皮的計(jì)算,都是在CPU中進(jìn)行的。在實(shí)際的游戲引擎中,這些都是分開處理的,較為通用的處理是將骨骼的動(dòng)畫數(shù)據(jù)驅(qū)動(dòng)放在CPU中,計(jì)算出骨骼的變換矩陣,然后傳遞給GPU中進(jìn)行蒙皮計(jì)算。在DX10的時(shí)候,一般的shader給出的寄存器的大小在128的大小,一個(gè)變換矩陣為4x4,如果去除*后一行(0,0,0,1)就可以用3個(gè)float表示,那么*多可以表示,嗯,42個(gè)左右,如果考慮進(jìn)行性能優(yōu)化,不完全占用寄存器的大小,那么一般會(huì)限制在30根骨骼的大小上。將這些骨骼的變換矩陣在CPU進(jìn)行計(jì)算后,就可以封裝成skin info傳遞到GPU中。
在GPU的計(jì)算中,就會(huì)取出這些mesh上的頂點(diǎn)進(jìn)行對(duì)應(yīng)的位置計(jì)算,基于骨骼的轉(zhuǎn)換矩陣和骨骼的權(quán)重,得到*新的位置,從而進(jìn)行一次頂點(diǎn)計(jì)算和描繪。之所以將骨骼動(dòng)畫的兩個(gè)部分分開處理,一個(gè)原因就是CPU的處理能力相對(duì)而言沒有GPU快捷,一般一個(gè)模型的骨骼數(shù)量是較小的,但是mesh上的頂點(diǎn)數(shù)量較大,利用GPU的并行處理能力優(yōu)勢(shì),可以分擔(dān)CPU的計(jì)算壓力。
在DX11還是DX12之后(記不太清楚),骨骼變換矩陣的計(jì)算結(jié)果不再存儲(chǔ)在寄存器中,而是存儲(chǔ)在一個(gè)buffer中,這樣的buffer大小基于骨骼數(shù)量的大小在第一次計(jì)算的時(shí)候設(shè)定,之后每次骨骼動(dòng)畫數(shù)據(jù)驅(qū)動(dòng)得到新的變換矩陣,就依次更改對(duì)應(yīng)的buffer中存儲(chǔ)的變換矩陣,這樣就不再受到寄存器的大小而限制骨骼的根數(shù)的大小。但是實(shí)際的優(yōu)化中,都會(huì)盡量?jī)?yōu)化模型的骨骼的數(shù)量,畢竟數(shù)量越多,*是影響頂點(diǎn)的骨骼數(shù)量越多,那么計(jì)算量就會(huì)越大,正常的思維是優(yōu)化骨骼數(shù)量而不是去擴(kuò)展buffer的大?。篋
在文章2中,對(duì)于GPU的蒙皮計(jì)算做了較大的性能優(yōu)化,主要的思維也是這樣,在CPU中進(jìn)行骨骼變換,將變換的結(jié)果傳遞到GPU中,從而進(jìn)行蒙皮計(jì)算。基本的思維和前面說的變換思維一致,其基本的優(yōu)化重點(diǎn)也是想利用一個(gè)buffer來緩存變換矩陣,從而優(yōu)化性能。這兒我就重點(diǎn)分析一下shader部分的代碼,其在cpu部分的代碼處理基本和前面的代碼思想一致:
如果采用CPU的計(jì)算骨骼變換,那么GPU的shader:
聲明: 本文轉(zhuǎn)自網(wǎng)絡(luò), 不做盈利目的,如有侵權(quán),請(qǐng)與我們聯(lián)系處理,謝謝。
uniform float4x4 _Matrices[24]; //設(shè)置的骨骼數(shù)量*大為24 struct appdata { float4 vertex:POSITION; float2 uv:TEXCOORD0; //存儲(chǔ)的就是骨骼的變換矩陣,x/y為第一個(gè)骨骼的索引和權(quán)重,z/w為第二個(gè)的索引和權(quán)重 float4 tangent:TANGENT; }; v2f vert(appdata v) { v2f o; //蒙皮計(jì)算位置,注意看,其實(shí)就是矩陣變化加權(quán)重的表示 float4 pos = mul(_Matrices[v.tangent.x], v.vertex)* v.tangent.y + mul(_Matrices[v.tangent.z], v.vertex)* v.tangent.w //通用的mvp計(jì)算 o.vertex = mul(UNITY_MATRIX_MVP, pos); o.uv = TRANSFORM_TEX(v.uv, _MainTex); return o; } //怎么計(jì)算index和權(quán)重,此處一個(gè)蒙皮頂點(diǎn)受到2根骨骼的影響 Vector4[] tangents = new Vector4[mesh.vertexCount]; for(int i=0; i < mesh.vertexCount;++i) { BoneWeight boneWeight = mesh.boneWeights[i]; tangents[i].x = boneWeight.boneIndex0; tangents[i].y = boneWeight.weight0; tangents[i].z = boneWeight.boneIndex1; tangents[i].w = boneWeight.weight1; } newMesh.tangents = tangents;其優(yōu)化的策略,就是用貼圖的方式來存儲(chǔ)這個(gè)變換矩陣,參看一下代碼吧:
inline float4 indexToUV(int index) { int row = (int) (index /_MatricesTexSize.x); int col = (index - row * _MatricesTexsize.x; return float4(col/_MatricesTexSize.x, row/_MatricesTexSize.y, 0 , 0); } //算出當(dāng)前的變換矩陣 inline float4x4 getMatrix(int frameStartIndex, float boneIndex) { int matStartIndex = frameStartIndex + boneIndex*3; float4 row0 = tex2Dlod(_MatricesTex, indexToUV(matStartIndx)); float4 row1 = tex2Dlod(_MatricesTex, indexToUV(matStartIndx + 1)); float4 row2 = tex2Dlod(_MatricesTex, indexToUV(matStartIndx + 2)); float4 row3 = float4(0,0,0,0); float4x4 mat = float4x4(row0, row1, row2, row3); return mat; } v2f vert(appdata v) { v2f o; float time = _Time.y; //算出當(dāng)前時(shí)間對(duì)應(yīng)的index int framIndex = (int)(((_Time.y + v.uv2.x)*_AnimFPS)%(_AnimLength * _AnimFPS)); int frameStartIndex = frameIndex * _MatricesTexFrameTexls; //去除對(duì)應(yīng)的變換矩陣 float4 mat0 = getMatrix(frameStartIndex, v.tangent.x); float4 mat1 = getMatrix(frameStartIndex, v.tangent.z); float4 pos = mul(mat0, v.vertex) * v.tangent,y + mul(mat1, v.vertex) * v.tangent.w; o.vertex = mul(UNITY_MATRIX_MVP, pos); o.uv = TRANSFOR_TEX(v.uv, _MainTex); return o; }
- 上一篇:UNITY3D的立體顯示方法(HTC VIVE) 2019/3/13
- 下一篇:UNITY3D運(yùn)行動(dòng)畫時(shí)修改局部骨骼的角度 2019/2/14