万象云档 本次搜索耗时 1.956 秒,为您找到 293 个相关结果.
  • 三、数据预处理

    三、数据预处理 为 Scikit-Learn 转换 Pandas 类别数据 删除带缺失值的观测 删除缺失值 检测离群点 离散化特征 编码序数类别特征 创建比例映射 使用下采样处理不平衡类 使用上采样处理不平衡类别 处理离群点 选择 1:丢弃 选择 2:标记 选择 3:重缩放 使用均值填充缺失值 拟合填充器 填充缺失的类标签 ...
  • 02 智能写作助手:Friday

    352 2025-05-09 《ChatGPT:AI革命》
    02 智能写作助手:Friday 02 智能写作助手:Friday Friday是一个在线的智能写作助手,其首页(https://www.heyfriday.cn/)如下图所示。其开发团队的领头人曾是谷歌的NLP科学家(NLP深度学习模型ALBERT的第一作者),团队中还聚集了来自世界各地的NLP资深算法工程师,他们致力于将机器与写作融合,打造具备心智...
  • 6.15 本章习题

    6.15 本章习题 本章海量数据的习题 6.15 本章习题 本章海量数据的习题 1 有100W个关键字,长度小于等于50字节。用高效的算法找出top10的热词,并对内存的占用不超过1MB。 提示:老题,与caopengcs讨论后,得出具体思路为: 先把100W个关键字hash映射到小文件,根据题意,100W_50B = 50_10^6B =...
  • 数据备份与还原

    1 数据备份 1.1 手动备份 1.2 自动备份 2 数据还原 概述 MeterSphere 的应用数据包括数据库以及 minio,可通过手动和自动两种方式进行数据备份,在备份过程中,为加强数据的安全性,建议采取本地加异地进行双重备份。 1 数据备份 注意 MeterSphere 若通过 1Panel 安装,则在 1Panel 页面进行数据...
  • 1.9 多线程

    1.9 多线程 1.9 多线程 在计算机编程中,一个基本的概念就是同时对多个任务加以控制。许多程序设计问题都要求程序能够停下手头的工作,改为处理其他一些问题,再返回主进程。可以通过多种途径达到这个目的。最开始的时候,那些拥有机器低级知识的程序员编写一些“中断服务例程”,主进程的暂停是通过硬件级的中断实现的。尽管这是一种有用的方法,但编出的程序很难移植,...
  • 第一篇 ChatGPT——令Google坐立不安,让微软All in

    第一篇 ChatGPT——令Google坐立不安,让微软All in 第一篇 ChatGPT——令Google坐立不安,让微软All in 语言是人类沟通交流的最主要工具之一,一直有互联网公司在挑战机器人智能沟通交流能力的极限。最早的有IBM的Watson,苹果用户惯用的Siri,后来还有微软小冰等。但用户的使用反馈并不是特别理想。因为,上述人工智能机...
  • 环境构建

    环境构建 undefined比赛环境搭建 undefined根据比赛章程,可知 undefined一、安装Ubuntu 18.0 undefined二、 安装Python SDK undefined三、验证环境搭建是否成功 环境构建 undefined比赛环境搭建 undefined根据比赛章程,可知 操作系统:Ubuntu 18.0 ...
  • 微服务治理策略

    微服务治理策略 服务的注册和发现 负载均衡 通讯 配置管理 容错和服务降级 服务依赖关系 服务文档 服务安全问题 流量控制 自动化测试 服务上线,下线的流程 兼容性 服务编排 资源调度 容量规划 微服务治理策略 服务的注册和发现 解决问题:集中管理服务 解决方法: Eureka Zookeeper 负载均衡 解...
  • 1.1.3 算法

    1.1.3 算法 1.1.3 算法 如前所述,程序是解决某个问题的指令序列。编程解决一个问题时,首先要找出解决问 题的方法,该解决方法一般先以非形式化的方式表述为由一系列可行的步骤组成的过程,然 后才用形式化的编程语言去实现该过程。这种解决特定问题的、由一系列明确而可行的步骤 组成的过程,称为算法(algorithm①)。算法表达了解决问题的核心步骤,...
  • 6.15 本章习题

    6.15 本章习题 本章海量数据的习题 6.15 本章习题 本章海量数据的习题 1 有100W个关键字,长度小于等于50字节。用高效的算法找出top10的热词,并对内存的占用不超过1MB。 提示:老题,与caopengcs讨论后,得出具体思路为: 先把100W个关键字hash映射到小文件,根据题意,100W_50B = 50_10^6B =...