猿人学web端爬虫攻防大赛赛题第3题——访问逻辑 - 推心置腹
题目网址:https://match.yuanrenxue.cn/match/3 解题步骤 看触发的流量包。 再看当前流量包中有没有什么特殊的字段。 没看到有特殊的字段,直接写代码访问。import requests url = "https://match.yuanrenxue.cn/api/ma ...
用图像增强来充实训练数据集,算不算是一种‘摸鱼’的方法?
序言:图像增强其实就是对现有图片做一些变化,让数据集看起来更多样化,减少去额外收集数据的需求。虽然从某种程度上来说,它能提高数据的质量,但严格来说它不是传统意义上的数据清洗。数据清洗的目的就是把数据里的错误、不一致或者缺失的部分给清理掉,让数据变得更干净、更好用。 图像增强 在上一节中,我们构建了一 ...
2024年10月总结及随笔之漏更及失而复得
1. 回头看 日更坚持了670天。 读《数据湖仓》更新完成 读《数据工程之道:设计和构建健壮的数据系统》开更并持续更新 2023年至2024年10月底累计码字1642797字,累计日均码字2451字。 2024年10月码字86801字,同比下降30.77%,环比下降6.65%,日均码字数2800字, ...
NLP segment-01-聊一聊分词 AI 的基础
拓展阅读 分词系列专题 jieba-fenci 01 结巴分词原理讲解 segment jieba-fenci 02 结巴分词原理讲解之数据归一化 segment jieba-fenci 03 结巴分词与繁简体转换 segment jieba-fenci 04 结巴分词之词性标注实现思路 speec ...
猿人学web端爬虫攻防大赛赛题第1题——js 混淆 - 源码乱码
题目网址:https://match.yuanrenxue.cn/match/1 解题步骤 点击页面,看触发的流量包。 只有一条,非常好确定,但是url中m参数的值看着比较奇怪,是一串加密的字符串加上“|”加上看着像是时间戳的东西。 去找其加密的逻辑。直接搜url中的关键词,但是没有结果。 如果要搜 ...
Java面试题中高级进阶(JVM篇Java内存)
本来想着给自己放松一下,刷刷博客,突然被几道面试题难倒!说说Java内存结构?说说对象分配规则?描述一下JVM加载class文件的原理机制?似乎有点模糊了,那就大概看一下面试题吧。好记性不如烂键盘 ...
论文速读记录 - 202410
坚持看论文不容易啊,十月也是多事之秋。看的论文有点少,也有点散,还是要专注一些具体的方向,梳理脉络,整理方案,才是看论文找解决方案的正确思路。 以后的每篇论文解读的后面,会附带一点个人看法/评论,如有冒犯还请见谅。 目录: LATE CHUNKING: CONTEXTUAL CHUNK EMBEDD ...
人工智能生产力悖论:为什么大多数人没用上AI工具?
真正的障碍不是技术,而是思考的时间: 虽然像ChatGPT这样的工具确实有潜力带来变革,但我接触的大多数人几乎不用它。就算用的,也只是用来做些总结之类的小活儿。而在这些用户里,只有大约5%的人订阅了高级版,这意味着真正用AI来搞复杂任务的“高手”少得可怜。下面的内容主要来自Shopify的AI和广告 ...
统信UOS 1040版本系统无法安装软件
问题发生 给工控机刷完统信UOS 1040d服务器版本系统后出现执行apt update的时候提示一堆错误: lww@lww-PC:~$ sudo apt update 错误:1 https://enterprise-packages.chinauos.com/server-enterprise f ...
DBeaver如何查看ER图
前言 我们在使用DBeaver时,有时候需要查看某张表的ER图,这能帮助我们快速看到表的结构,那么,我们应该如何在DBeaver里面查看ER图呢? 如何查看 首先,我们点击下我们要查看的某张表,鼠标右击一下。 然后,我们点击下ER图这个选项。 最后,我们就可以看到该表的ER图了。 总结 在DBeav ...
【开发笔记241025】她趣介意时效超5分钟的付款交易。简单一招,应对!
她趣介意时效超5分钟的付款交易。简单一招,应对! 我们平台近期入网一个新客户是她趣。她趣这个企业比较关注下发时效,他们那边系统做了告警,当存在超5分钟时效的交易,就会发告警。然后,那边的人就来质问。并声称,现在只是放了3%的量,就总出现下发慢的交易,如果10月份剩下的这5天里依然存在,就不打算用我们 ...
orange人工智能分类问题
实验介绍: 一:多分类问题 我们想要机器自动识别不同种类的生物,这就涉及到多分类问题。 支持向量机的介绍 讲得很好引用一下 支持向量机SVM详解 支持向量机和逻辑回归的区别是:逻辑回归是找一条曲线把数据分开,支持向量机就是找一个宽马路把不同类数据隔得越远越好 支持向量机对异常数据的容忍就会好一些 搭 ...
《使用Gin框架构建分布式应用》阅读笔记:p272-p306
《用Gin框架构建分布式应用》学习第15天,p272-p306总结,总35页。 一、技术总结 1.TDD(test-driven development) 虽然经常看到TDD这个属于,从本人的工作经历看,实际开发中用得相对较少。 2.unitest(单元测试) go语言开发中,使用testify进行 ...
『模拟赛』多校A层冲刺NOIP2024模拟赛16
Rank 依托,给我烂完了( A. 四舍五入 唐题,赛时被硬控 3h。 发现枚举 \(i\) 是一个很没前途的选择,分成三段后仍然需要 \(\mathcal{O(n)}\) 去跑 \(\left[1,\lfloor{\frac{i}{2}}\rfloor\right]\) 这一段,复杂度仍是 \(\ ...
orange人工智能回归问题
实验介绍: 橙现智能是一款可视化,无编程,无门槛的免费人工智能软件。 机器也可以学习,机器学习可以简单理解成总结经验,发现规律,掌握规则,预测未来。 [此处插入图片],该图片作者为未知,来源于百度,仅学习非商用。 一:软件的安装 中文版本下载地址 https://pan.baidu.com/s/1T ...
[ZJOI2019] Minimax搜索 题解
\(\texttt{link}\)。 感觉是道好题,我们先稍微理一下思路。 首先,我们定义在初始状态下,根节点的权值为 \(W\)。 先考虑一个差分的技巧,即我们对于每个 \(k\),求出 \(w(S) \le k\),\(S\) 的个数,然后 \(k\) 的答案就是用 \(\le k\) 的个数减 ...
每日互动基于 Apache DolphinScheduler 从容应对ClickHouse 大数据入库瓶颈
引言 大家好,我叫张琦,来自每日互动,担任大数据平台架构师。今天我将分享我们团队在基于Apache DolphinScheduler实现ClickHouse零压入库过程中的实践经验。 这个实践项目涉及到两个关键组件:Apache DolphinScheduler和ClickHouse,主要是我们在实 ...
郑州招聘项目经理1人。3.5+万/月
电商/跨境业务,base在郑州 岗位职责:1、理解公司业务愿景和发展战略,制定公司技术中台的愿景,发展战略,路径规划; 2、领导和 配合团 队,保障技术路线的先进性 ,组织定技术发展战略、规划发展方向,设计和改进中台技术架构并推动实施; 3、优化开发流程,提升团 队开发效率,保障业务开发进度 、质量 ...