Basic Idea

基本认识

self-supervised learning：设计不需要标注数据的pre-train任务来训练模型，如填空题、预测下一个token。

Auto-Encoder可以看作是 Self-Supervised Learning 的一种 Pre-Train 的方法。

Untitled

Encoder 把一张图片读进来,它把这张图片**变成一个向量（Embedding，Representation，Code），**作为Decoder 的输入。架构可能类似于多层的network，CNN。
Decoder 输入向量，产生一张图片。所以 Decoder 的 Network 的架构,可能会像是 GAN 裡面的 Generator

训练的目标是希望,Encoder 的输入跟 Decoder 的输出,越接近越好

<aside> 💡 Reconstruction,重建：把图片看作是一个很长的向量的,希望这个向量跟 Decoder 的输出这个向量越接近越好

</aside>

Cycle GAN：第一个 Generator,把 X Domain 的图片转到 Y Domain,另外一个 Generator,把 Y Domain 的图片转回来,希望最原先的图片,跟转完两次后的图片越接近越好。 06-Generative Model(GAN)

图片可以看作是一个很长的向量,但这个向量太长了不好处理。

⇒丢到 Encoder 以后,输出另外一个向量,这个向量会比较短。

**⇒图片不再是一个很高维度的向量,它通过 Encoder 的压缩以后,变成了一个低维度的向量。**拿这个新的向量来做你接下来的任务。

Bottleneck：输入是很宽的（维度很高）,输出也是很宽的，中间特别窄（维度低）

Untitled