• 卡比
  • 🇬🇧 EN
  • Weekly
  • About
  • Categories
Be yourself and don't go with the flow.

CUDA 执行模型

【2024-08-28】在 CUDA 执行模型中,线程 thread、线程块 block 和网格 grid 是组织和执行并行计算的基本单位(也叫 CUDA 线程模型)。

CUDA 内核优化策略

【2024-08-25】简单介绍 cuda 内核优化策略。

CUDA内存组织

【2024-08-23】剖析核函数与全局内存的联系及其对性能的影响。

CUDA 编程模型概述

【2024-08-21】CUDA 编程模型提供了一个计算机架构抽象作为应用程序和其可用硬件之间的桥梁,并利用 GPU 架构的计算能力提供了以下几个特有功能:线程和内存层次结构。

CUDA 背景知识

【2024-08-20】介绍 V100 gpu 硬件架构、cuda 内核函数如何计时。

埃隆·马斯克传 - 读书笔记

【2024-04-14】最近利用早上的阅读时间陆陆续续把《埃隆·马斯克传》给看完了,很推荐工程师同学一读,虽然平时马斯克在 X 上表现有些奇怪,其实在书里其实是一个实打实的工程师,很擅长将技术和商业以及成本控制结合的一个牛人,不过也有不少缺点的一个人,随手记录一些文字用于备忘。同样看完这本书,作为特斯拉股东,愿意继续持有。

internlm2-20b 在 910b 适配记录

【2023-12-26】华为 910b 适配 InternLM2-20b 模型记录。

lightllm 性能瓶颈分析

【2023-11-01】LightLLM 推理框架静态性能测试及分析

tgi 性能瓶颈分析实验

【2023-10-26】TGI 动态性能测试实验分析

tgi 框架源码快速总结

【2023-09-20】TGI 框架的主要功能,以及主要模块的简单介绍。
  • <
  • 1
  • …
  • 4
  • 5
  • 6
  • 7
  • 8
  • …
  • 11
  • >
github Twitter RSS github 2015~2025