0

NLP segment-03-基于 TF-IDF 实现关键词提取 java 开源实现

拓展阅读 分词系列专题 jieba-fenci 01 结巴分词原理讲解 segment jieba-fenci 02 结巴分词原理讲解之数据归一化 segment jieba-fenci 03 结巴分词与繁简体转换 segment jieba-fenci 04 结巴分词之词性标注实现思路 speec ...

老马啸西风 发布于 2024-11-01 20:39 评论(0)阅读(37)
0

Bulletproof范围证明之原理

主页 微信公众号:密码应用技术实战 博客园首页:https://www.cnblogs.com/informatics/ GIT地址:https://github.com/warm3snow 简介 在《门罗币隐私保护之机密交易》中,我们提到了Bulletproof范围证明技术,用于证明交易金额(Pe ...

warm3snow 发布于 2024-11-01 20:26 评论(0)阅读(265)
0

深入解析 Transformers 框架(三):Qwen2.5 大模型的 AutoTokenizer 技术细节

本文是 Transformers 推理大语言模型技术细节的第 3 篇,基于 Qwen2.5 大模型,通过源代码走读,详细介绍了 AutoTokenizer 的分词器初始化、存储流程和技术细节。文章涵盖分词器的配置解析、字节对编码(BPE)分词算法,以及分词、编码、解码和添加 Token 等常用操作…... ...

老牛啊 发布于 2024-11-01 20:25 评论(0)阅读(1152)
5

『模拟赛』多校A层冲刺NOIP2024模拟赛17

Rank 一般 A. 网络 签不上的签到题。 首先考虑枚举路径的做法,如果先枚举再计算的话复杂度会是 \(\mathcal{O(\binom{n+m-2}{n-1}(n+m))}\) 的,稍微优化一点的过程中可以去掉后面的 \((n+m)\)。考虑此时我们要记什么,首先遇到加号其前面的值 \(z\) ...

Ratio_Y 发布于 2024-11-01 20:05 评论(3)阅读(83)
0

Unleashing Reasoning Capability of LLMs via Scalable Question Synthesis from Scratch

1. 概述 LLM的SFT数据合成工作不可避免的可以划分为多个阶段: 指令合成 响应合成 数据筛选。 本篇文章采用了传统LLM的训练过程(SFT+DPO)进行数据合成。 在领域专有模型(DeepSeekMath7B-RL,Qwen2-Math-7BInstruct)的基础上, 指令合成:通过QFT( ...

啊哈哈哈哈312 发布于 2024-11-01 19:52 评论(0)阅读(101)
0

采集电力 IEC104 转 profinet IO 项目案例

VFBOX协议转换网关支持PLC,modbus,EthernetIP,Profinet,CCLink,EtherCAT,IEC61850,IEC104,bacnet,DLT645,HJ212,opc ua,opc da,DNP3。 ...

vfbox-2212 发布于 2024-11-01 18:28 评论(0)阅读(33)
0

猿人学web端爬虫攻防大赛赛题第4题——雪碧图、样式干扰

题目网址:https://match.yuanrenxue.cn/match/4 解题步骤 看触发的数据包。 响应数据中可以看到明显的图片base64编码,去一个值解码一下,可以得到图片。(https://the-x.cn/encodings/Base64.aspx) 看来这个页面是通过图片进行回显 ...

死不悔改奇男子 发布于 2024-11-01 17:32 评论(0)阅读(103)
1

树的直径

树上任意两节点之间最长的简单路径即为树的直径。一棵树可以有多个直径,他们的长度相等。 方法一:两次DFS:缺点:仅适用于正边权,优点:方便记录直径的路径,时间复杂度为:O(n) 方法二:树形DP:优点:也适用于负边权,缺点:不方便记录路径,时间复杂度:O(n) 方法一:两次DFS: 1.从任意节点出 ...

zsfzmxl 发布于 2024-11-01 17:06 评论(0)阅读(38)
0

刷题-1

1.进程/线程/协程 进程与线程: 进程是资源分配的独立单位,线程是资源调度和分配的最小单位。 资源拥有:进程拥有独立的地址空间。而统一进程下的线程共享地址空间和资源,包括内存/文件句柄等。 通信方式:进程通信有特定的机制,比如管道/共享内存/消息队列/信号等方式。而线程因为内存等资源是共享的,所以 ...

寒柏懒得想 发布于 2024-11-01 17:00 评论(0)阅读(9)
0

RTX5/FreeRTOS全家桶源码工程综合实战模板集成CANopen组件(2024-10-30)

【前言】 之前的视频教程分享了两期CANopen的专题,配套的例子都是基于裸机的,为了方便大家在OS下使用,本期视频带OS下的支持。 CANopen协议栈专题,实战方式系统了解NMT,PDO,SDO,时间戳,同步报文,紧急报文等(2023-10-17) https://www.armbbs.cn/f ...

硬汉嵌入式 发布于 2024-11-01 16:25 评论(0)阅读(66)
0

ROLL: Long-Term Robust LiDAR-based Localization With Temporary Mapping in Changing Environments

开源代码:GitHub - HaisenbergPeng/ROLL: A real-time, robust LiDAR-inertial localization system ROLL: Long-Term Robust LiDAR-based Localization With Tempora ...

Gaowaly 发布于 2024-11-01 16:20 评论(0)阅读(73)
0

华为云开源项目Sermant正式成为CNCF官方项目

Sermant自2021年底开源至今,备受开源社区和产业界的广泛关注和支持,目前社区共有3个子项目,总共收获超过1200个GitHub Star和超过200个Fork。 ...

华为云开发者联盟 发布于 2024-11-01 16:02 评论(0)阅读(25)
0

项目实战:Qt+OpenCV仿射变换工具v1.1.0(支持打开图片、输出棋盘角点、调整偏移点、导出变换后的图等等)

需求 1.打开图片; 2.矫正识别角点; 3.opencv摄像头操作子线程处理; 4.支持设置棋盘格的行列角点数; 背景 深入研究图像拼接细分支算法,产出的效果查看工具,验证算法单步思路。 相关博客 《项目实战:Qt+Opencv相机标定工具v1.3.0(支持打开摄像头、视频文件和网络地址,支持标定 ...

长沙红胖子Qt创微智科 发布于 2024-11-01 15:58 评论(0)阅读(37)
0

Angular 18 上手开发

0x01 概述 (1)简介 官方网站:https://www.angular.cn/ Angular 由 Google 的专业团队维护,Angular 提供了广泛的工具、API 和库,简化和优化开发工作流程 Angular 提供了一个坚实的平台,可用于构建快速、可靠、能够随着团队规模和代码库规模扩展 ...

SRIGT 发布于 2024-11-01 15:36 评论(0)阅读(222)
0

Golang 开源库分享:faker - 随机生成有趣的假数据!

GitHub 仓库链接:https://github.com/bxcodec/faker 简介 在开发和测试过程中,我们经常需要各种各样的测试数据。如果手动去生成这些数据,不仅耗时,还容易出错。faker 是一个 Go 语言的假数据生成库,可以快速生成各种字段的随机数据。这个库可以帮我们轻松生成各种 ...

MARIOOW 发布于 2024-11-01 14:45 评论(0)阅读(204)
0

TOYOTA SYSTEMS Programming Contest 2024(AtCoder Beginner Contest 377) 补题记录(A-E)

AtCoder Beginner Contest 377 A - Rearranging ABC 字符串有ABC三个字母即可。 #include<bits/stdc++.h> using namespace std; #define int long long signed main() { str ...

ZhangDT 发布于 2024-11-01 14:42 评论(0)阅读(37)
0

资源利用率提高30%,揭秘华为云Serverless高效、高密度调度优化原理

本文介绍了华为云对调度优化这一业界难题的探索之路,创新性提出了基于JIAGU的高效的资源优化调度系统。 ...

华为云开发者联盟 发布于 2024-11-01 14:42 评论(0)阅读(75)
0

Windows内核驱动-进程回调

一、核心代码 一共三部分: 定义回调函数 注册回调 移除回调 #include <ntddk.h> // 定义回调函数,在后续实现 VOID ProcessNotifyRoutine( _Inout_ PEPROCESS Process, // 进程对象,这是个不透明结构,不建议强行使用其中的字段 ...

轻聆月下 发布于 2024-11-01 13:24 评论(0)阅读(91)
0

聊聊公众号联动扫码登录功能如何实现

大家好,我是 V哥。扫码登录是个很普遍的功能,通过与公众号联动实现扫码登录功能,要怎么做呢,V 哥整理了以下步骤和代码,供你参考。这里假设你已经有一个Java后端应用,并且微信开发者平台的配置也已经完成。(相信你可以根据微信开放平台的操作进行)整个流程包括二维码生成、扫码后获取微信用户信息、并将用户 ...

威哥爱编程 发布于 2024-11-01 12:23 评论(0)阅读(167)
0

Oracle与GreatSQL差异:更改唯一索引列

Oracle与GreatSQL差异:更改唯一索引列 1.问题来源 在从Oracle迁移到GreatSQL的应用系统中,一条普通的update语句在GreatSQL中却报错,需要进行SQL语句的改写。把实际问题简化为下面简单情况进行说明。 在Oracle下,可以正常执行的update语句。 -- 建表 ...

GreatSQL 发布于 2024-11-01 11:21 评论(0)阅读(28)