时间线

esc

请输入并搜索

Ctrl+K

时间线

6 分类 × 39 文章 × 0 标签 × 114172 字

2024

39篇

+

各类位置编码分析

为什么计算机专业一定不要考研

LLama系列模型架构分析

TIES-MERGING高效模型合并

网易-NLP算法实习生一面，我用梯度下降优化自己

transformer代码

“走出去，见世面”是年轻人最值得做的事

GPT 1 ,2 ,3 论文

Word2vec词向量

被大厂HR、技术官指点简历后，我悟了！

辉哥论文推荐（7.8-10.31）

Transformer面试问

AI大模型资源汇总

模型极限压缩论文笔记

# Mixture-of-Subspaces in Low-Rank Adaptation

LLama.cpp在cpu上部署模型

《重构---年轻人的精进指南》读书篇之“大公司好还是小公司好？”

计算机怎么学？工作不对口? 我怎么看

计算机专业学生该如何破圈？摆脱“码农”

李沐：创业一年，人间三年

工作是第一生产力，兴趣是第二生产力

AI时代来临，计算机程序员该怎么走好这条路？

变的是数据来源，没变的是数据质量

模型极限压缩论文笔记

Mixture-of-Subspaces in Low-Rank Adaptation

Xlora，一种与MOE相似的lora门控

有关大模型幻觉与灾难性遗忘

新一代模型微调方案LLama-Pro ，快来围观！！！

新型AI大模型微调方式：ReFT 表征微调

Wise-ft《Robust fine-tuning of zero-shot models》，能解决大模型持续学习灾难性遗忘吗

VERA : 一种比Lora更省资源的微调方案

在大二拿到了一份心仪的Offer，我是怎么一步步打怪升级的？

大模型学习资料

花半小时，部署自己的博客网站

Bob

NLP算法实习生，就喜爱捣鼓LLM的fine-tunning，热衷于技术变现。