![AIGC原理与实践:零基础学大语言模型、扩散模型和多模态模型](https://wfqqreader-1252317822.image.myqcloud.com/cover/190/51549190/b_51549190.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.3.2 生成模型的概率表示
如何从一组观察数据中学到符合要求的模型pmodel?模型pmodel可看作一条曲线,如图1-5右图所示。而神经网络可以拟合任何一条曲线,为此我们可以通过神经网络来构建模型pmodel。假设一组样本构成的数据集为χ,神经网络的参数集为θ(如可表示神经网络中权重参数w及偏置b等),我们要求的分布函数可表示为:
![](https://epubservercos.yuewen.com/B4645E/30403237107613906/epubprivate/OEBPS/Images/18_02.jpg?sign=1739090467-TmLuoFnkfb8djOaCbs8Z8ESH50cKTC74-0-4e71f8946cbe6de380ad6f440ed42cfa)
对于给定的观察数据x,参数θ的似然函数(即在参数化的模型中观察到的样本数据的概率,第13章有进一步的说明)为:
![](https://epubservercos.yuewen.com/B4645E/30403237107613906/epubprivate/OEBPS/Images/19_01.jpg?sign=1739090467-hl13OAd03Dd8GPSPbBlPSjPozxtDK7AX-0-e65a843919613907ee419b044012177b)
如果数据集χ由一组独立同分布的样本x构成,即χ={x1,x2,…,xn},则数据集χ的似然函数可表示为;
![](https://epubservercos.yuewen.com/B4645E/30403237107613906/epubprivate/OEBPS/Images/19_02.jpg?sign=1739090467-hrE1JiOBSIJETs4sSheXIVCKAm8I7RMY-0-421ed94cb86dd6095a6a5560fad07d2c)
由于概率乘积的计算难度较大,我们一般采用对数似然函数:
![](https://epubservercos.yuewen.com/B4645E/30403237107613906/epubprivate/OEBPS/Images/19_03.jpg?sign=1739090467-fv6psPR6EuBJE9lddiJUmcegNdLAxddK-0-b0e5624f44c180cd20a3573a81514ce0)