Chenxi Ma
PPO
Initializing search
    Academic-Profile
    • AI
    • 其他有用技术
    • Projects
    • Publications
    • CV
    • Contact me
    • Tags
    Academic-Profile
          • 如何找idea
          • 论文写作
                • Transformer
                • Tokenization分词器
                • Tokenization补充
                • Word Embedding词嵌入
                • Positional Embedding位置编码
                • Attention注意力
                • Attention(2)
                • FFN和激活函数
                • Mask掩码
                • Normalization
                • Encoder and Decoder
            • PPO
              • Encoder-only预训练任务
              • BERT
              • Sentence-BERT
            • 大模型预训练概述
            • 预训练数据
            • 基于SentencePiece扩充LLaMa中文词表
              • Deepseek:基座模型发展
              • Deepseek:reasoning
              • Deepseek v3
              • Deepseek r1
            • 机器人基座模型与VLA概述
            • ALOHA机器人平台:低成本、高精度双臂操作及其进展深度解析
            • 通用智能体与机器人Transformer:Gato和RT-1技术解析及与LLM Transformer的异同
            • Octo——机器人操控的通用框架
            • Cross-former
            • GR-1
            • GR-2
            • TTRL
            • LCPO
        • git理解
          • cpp基础语法
          • conpile and link
          • 项目结构
      • Conferences
      • 个人简历
    • Contact me
      • 个人标签

    PPO

    Previous
    Encoder and Decoder
    Next
    Encoder-only预训练任务
    Made with Material for MkDocs