陈沙克日志

「尽量记录自己经历的一切」

How Many GPU Need For LLM Training

大模型算力计算

大模型要什么了解,最好的入门,就是计算训练一次大模型,需要多少张卡,多少时间。这个过程中,真的接触很多新的词汇。 参考文章 大模型训练为什么用 A100 不用 4090 语言模型的训练时间:从估算到 FLOPs 推导 大模型算力推演优化实战 OpenAI 总监演讲 深刻理解上面材料的内容,总结。 FLOPS FLOPS(floating-point ope...

Purpose of Llama-2 Files

Llama-2文件用途介绍

日常访问huggingface的大模型,基本都是可以看到一堆文件,具体的用途,其实是一直困惑我的问题。今天整理一下。 需要致谢一下这位博主:01coder 分享。 Tokenizer说明 总结 特斯拉前AI总监Andrej Karpathy使用说,大模型本质就是2个文件,一个是参数文件(权重文件,整个神经网络的权重),一个是包含运行这些参数的代码文件(用来运行这个神经网络的代码,可以...

colab记事本

record all I use

已经成为Colab的深度用户,整理一下我colab使用的内容,基本都是和huggingface和大模型有关,其实也是方便自己查询。现在已经记不住东西。 密钥 登录huggingface是需要密钥,把colab的notebook分享出去,这个会导致你的密钥泄露。你是可以提前处理,但是总会有忘记的时候。 Colab提供密钥管理的功能,你可以把Huggingface的token存放并在col...

Transformers 学习

Transformers入门

下面的内容都是来自各个学习的视频,我针对视频,整理我的理解。非常感谢这些博主的分享,我安装Llama 2一个多月,一堆问题,都是需要慢慢的解决和理解.下面是我做的笔记。 你可是处女座啊 Transformers 常见自然语言处理任务 情感分析(sentiment-analysis):对给定的文本分析其情感极性 文本生成 (text-generation) : 根据给定的文本...

How To Download LLM Llama 2

国内高效下载HuggingFace大模型

下载大模型,都是通过huggingface。以前Llama 2的下载,必须通过Meta才能下载,直接使用Meta的代码去Meta官方下载,国内是很容易中断,导致无法下载。现在你通过了Meta申请通过后,可以直接在huggingface进行下载。 介绍 国内从HuggingFace 下载大模型,也不容易,目前国内已经是无法直接访问HuggingFace。各种的mirror,代理,其实都...

LLaMA2 FAISS LangChain for QA

Colab Deploy LLaMA 2.0, FAISS and LangChain

Colab Google 提供的colab实在是太方便了。免费用户,可以使用T4的GPU,通过这个基本可以完成很多实验。这次 LLaMA 2.0(大模型), FAISS(向量数据库) and LangChain(链) 来实现一个最问答系统的demo。这次实验是通过notebook来完成,把整个操作的过程都记录下来。 Using LLaMA 2.0, FAISS and LangChain...

LLama2-7B Models Quantization Method

Quantization Method GGUF GPTQ AWQ

希望可以从零开始,一步一步进行模型的微调。发现第一步,就是需要拿llama 2的原始模型,进行格式的转换,国内外使用HuggingFace模型格式(简称HF格式)和其配套的通用代码进行微调是主流。这里就记录格式转换全过程。 超详细LLama2+Lora微调实战 访问HuggingFace,很多模型提供GGML,GGUF格式和GPTQ格式,目前GGML格式已经淘汰,使用GGUF替代,其实...

AI-Terminology

AI专业术语

专门用一篇blog来记录遇到新的AI专业术语,这些术语有时候含义,不是那么容易查询。 GPTQ stands for “Generative Pre-trained Transformer Quantization”. 表示这个模型是支持GPU GGML GGML is a Tensor library for machine learning, it is just a C++ l...

Text generation web UI And Llama 2

Manual Installation of Text generation web UI

为了加深自己对AI涉及的软件和工具深入了解。这次采用手工的方式进行安装Text generation web UI And Llama 2. 感谢 Text generation web UI 安装文档写的如此详细,我只是重复做了一遍,记录下来。 目前CPU是没问题,GPU应该由于模型下载的原因,导致还无法运行,正在解决中。 Install Conda 这一步可以省掉,如果是在阿里魔...

llama2 一键安装

Build a Local Llama2 in script

开始写文章的时候,其实我还没开始安装,先把整个过程记录下来。 阿里大模型社区魔搭,提供36小时的一台GPU虚拟机,我想我应该可以充分利用这个资源,来完成机器人的搭建过程。 感觉这是一个庞大工程,对我来说,需要分几篇文章来熟悉和了解。 模型分类 通过 HuggingFace 注册和下载相应的大模型。一个模型,给你提供的选项也很多,搞清楚他们的区别,其实也是非常不容易。就针对Llama ...