2025-04-18
基本类型和包装类型的区别?
用途:除了定义一些常量和局部变量之外,我们在其他地方比如方法参数、对象属性中很少会使用基本类型来定义变量。并且,包装类型可用于泛型,而基本类型不可以。
存储方式:基本数据类型的局部变量存放在 Java 虚拟机栈中的局部变量表中,基本数据类型的成员变量(未被 static 修饰 )存放在 Java 虚拟机的堆中。包装类型属于对象类...
Read More
2025-02-13
模型架构层
DeepSeekMoE架构相对于传统的Transformer架构,做了以下几项主要改进:
Mixture of Experts (MoE):
DeepSeekMoE引入了路由专家(routed experts)和共享专家(shared experts)。与传统的Transformer不同,DeepSeekMoE可以根据输入动态选择不同的专家,...
Read More
2025-01-10
Neo4j 图数据库简介
Neo4j 是一种基于 图模型 的开源图数据库,专为存储和查询高度连接的数据而设计。与传统关系型数据库不同,Neo4j 的底层原理专注于实体(节点)和它们之间的关系(边)的直接存储和管理,具有高效处理复杂连接查询的能力。
以下是 Neo4j 的简介和底层原理:
一、Neo4j 简介
1. 主要特点
图模型:
数据存储为节点(N...
Read More
2025-01-09
Jvm
1. 一次编写,处处运行(Write Once, Run Anywhere)
Java 程序被编译成 字节码(.class),不是平台相关的机器码。
字节码由 JVM 解释或编译执行,只要目标机器有 JVM,就能运行。
不需要为每个操作系统单独编译!
举例:
12345你写了一个 HelloWorld.java→ 编译得到 HelloWorld....
Read More
2024-12-27
张量
当张量的形状为 (3, 4, 4) 时,可以将其理解为一个 包含多个层的神经网络模型。让我们用 特征和权重 来比喻:
比喻解释
假设你有一个神经网络模型,输入层有 4 个特征(即 4 个特征值),并且你有 4 个权重值用于每个特征的计算。
3:表示神经网络中有 3 个不同的层(例如 3 个不同的神经网络中的权重矩阵)。
4:每个层的 输入特征有 4 ...
Read More
2024-12-24
教程地址:基于transformers的自然语言处理(NLP)入门
常见的NLP任务
文本分类:对单个、两个或者多段文本进行分类。举例:“这个教程真棒!”这段文本的情感倾向是正向的,“我在学习transformer”和“如何学习transformer”这两段文本是相似的。
序列标注:对文本序列中的token、字或者词进行分类。举例:“我在国家图书馆学tra...
Read More
2024-12-20
GraphRAG
仓库地址:GraphRAG
GraphRAG(Graph-based Retrieval Augmented Generation,基于图的检索增强生成)是一种利用图结构来增强大型语言模型(LLM)检索能力的先进方法。它旨在解决传统 RAG 方法在处理复杂关系、全局性问题和多跳推理方面的局限性。以下是 GraphRAG 的一些实现原理和技术...
Read More
2024-12-19
文章参考:神经网络中的三个基本概念
2.0 通俗地理解三大概念
这三大概念是:反向传播,梯度下降,损失函数。
神经网络训练的最基本的思想就是:先“猜”一个结果,称为预测结果 $a$,看看这个预测结果和事先标记好的训练集中的真实结果 $y$ 之间的差距,然后调整策略,再试一次,这一次就不是“猜”了,而是有依据地向正确的方向靠近。如此反复多次,一直到预测结果和...
Read More
2024-12-17
当异步方法提供服务时,调用方通常需要一种机制来知道异步方法什么时候返回结果以及是否执行成功。在 Spring Boot 中,这可以通过返回 Future、CompletableFuture 或使用回调机制来实现。
1. 使用 Future 接口
@Async 方法可以返回一个 Future 对象,调用方可以通过 Future 的方法查询执行状态和结果。
示例...
Read More
2024-11-22
expo是什么?
Expo 是一个用于构建原生应用的工具集合,它提供了一组工具和框架,用于开发跨平台应用。Expo 提供了简化原生应用的开发过程的工具,如自动构建和发布,以及集成各种第三方库。
Expo 的介绍
Expo 是一个用于构建 React Native 应用的工具链,提供了一种快速搭建、开发、测试和发布移动应用的方法。它简化了 React Nati...
Read More