网站首页 站内搜索

搜索结果

查询Tags标签: counts,共有 57条记录
  • 2.安装Spark与Python练习

    一、安装Spark检查基础环境hadoop,jdk 2.下载spark 3.配置文件配置环境vim /usr/local/spark/conf/spark-env.sh二、Python编程练习:英文文本的词频统计1.准备文本文件2.统计每个单词出现的次数 counts = {} for word in afterwords: counts[word] = coun…

    2022/3/8 22:14:44 人评论 次浏览
  • 2.安装Spark与Python练习

    一、安装Spark检查基础环境hadoop,jdk下载spark 解压,文件夹重命名、权限 配置文件环境变量 试运行Python代码二、Python编程练习:英文文本的词频统计准备文本文件 读文件 预处理:大小写,标点符号,停用词with open("Under the Red Dragon.txt", "r&qu…

    2022/3/8 20:14:57 人评论 次浏览
  • 2.安装Spark与Python练习

    一、安装Spark 1.检查基础环境hadoop,jdk 2.配置文件vim /usr/local/spark/conf/spark-env.sh 3.环境配置gedit ~/.bashrc 4.试运行Python代码 二、Python编程练习:英文文本的词频统计 1.准备文本文件2.读文件f=open("mystory.txt","r") ljjstory=f…

    2022/3/7 1:16:31 人评论 次浏览
  • 2.安装Spark与Python练习

    一、安装Spark 1、检查基础环境hadoop,jdk2、下载spark (省略,原来已下好)3、解压,文件夹重命名、权限 (省略,原来已下好)4、配置文件 5、环境变量6、试运行Python代码 试运行spaark python命令测试二、Python编程练习:英文文本的词频统计 1、准备文本文件 2、读文…

    2022/3/6 20:15:17 人评论 次浏览
  • 安装spark与python

    一、安装Spark 1.检查基础环境 启动hdfs查看进程 查看hadoop和jdk环境 2.下载spark3.配置环境变量 4.启动spark5.试运行python代码二、Python编程练习:英文文本的词频统计 1.准备文本文件 从网上下载一篇名为《hamlet》的小说,命名为hamlet.txt2.读文件txt = open("…

    2022/3/6 17:15:04 人评论 次浏览
  • 安装Spark与python练习

    一、安装Spark 基础环境--环境准备检查 安装spark 配置相关文件 查看spark配置 打开spark 在pyspark中运行代码Python实现英文文本的词频统计 准备文本文件 读文件txt = open(lol.txt, "r", encoding=UTF-8).read() 预处理:大小写,标点符号,停用词txt = txt…

    2022/3/3 1:17:43 人评论 次浏览
  • 2.安装Spark与Python练习

    一、安装Spark检查基础环境hadoop,jdk 配置文件 环境变量 试运行Python代码 二、Python编程练习:英文文本的词频统计准备文本文件 读文件 预处理:大小写,标点符号,停用词 分词 统计每个单词出现的次数 按词频大小排序 结果写文件with open("Under the Red Dragon…

    2022/3/2 17:16:23 人评论 次浏览
  • 2.安装Spark与Python练习

    一、安装Spark 配置文件试运行Python代码二、Python编程练习:英文文本的词频统计 1. 准备文本文件2.读文件 path=/home/hadoop/wc/f1.txt with open(path) as f: txt=f.read() 3.预处理 大写转小写 txt = txt.lower() 标点符号点击查看代码 for ch in !"@#$%^&*…

    2022/3/2 14:18:27 人评论 次浏览
  • 2.安装Spark与Python练习

    一、安装Spark 验证截图: (Spark运行成功) (基本操作以及简单运算) 二、Python编程练习:英文文本的词频统计源码:path=/home/hadoop/wc/f1.txt with open(path) as f:#text read and downtext=f.read()text = text.lower()#replace marksfor ch in !"@#$%^&a…

    2022/3/2 12:15:12 人评论 次浏览
  • Java、统计一位数的个数

    编写一个程序,生成0和9之间的100个随机整数,然后显示每一个数出现的次数。 提示:使用(int) (Math.random() * 10)产生 0 和 9 之间的100个随机整数,使用一个名为counts的由10个整数构成的数组存放 0 ~ 9 的个数。package pack2;public class Statistics {public stati…

    2022/2/28 14:21:25 人评论 次浏览
  • 利用jieba库和wordcloud库,进行中文词频统计并利用词云图进行数据可视化

    目录利用jieba库和wordcloud库,进行中文词频统计并利用词云图进行数据可视化安装jieba库安装wordcloud打开pycharm编写代码 利用jieba库和wordcloud库,进行中文词频统计并利用词云图进行数据可视化 安装jieba库打开cmd输入pip install jieba 验证:python -m pip list安…

    2022/2/26 6:26:46 人评论 次浏览
  • elasticsearch算法之推荐系统的相似度算法(一)

    一、推荐系统简介 推荐系统主要基于对用户历史的行为数据分析处理,寻找得到用户可能感兴趣的内容,从而实现主动向用户推荐其可能感兴趣的内容; 从物品的长尾理论来看,推荐系统通过发掘用户的行为,找到用户的个性化需求,从而将长尾商品准确地推荐给需要它的用户,帮助…

    2022/1/27 9:34:34 人评论 次浏览
  • PHP笔记-表格及分页功能

    运行截图如下: 前端代码如下: Student.php <!DOCTYPE html> <html lang="en"> <head><meta charset="UTF-8"><title>Title</title> </head> <body><h1>HelloWorld</h1><table bord…

    2022/1/10 12:33:41 人评论 次浏览
  • PHP笔记-表格及分页功能

    运行截图如下: 前端代码如下: Student.php <!DOCTYPE html> <html lang="en"> <head><meta charset="UTF-8"><title>Title</title> </head> <body><h1>HelloWorld</h1><table bord…

    2022/1/10 12:33:41 人评论 次浏览
  • Python一些可能用的到的函数系列85 计算熵

    说明 信息熵用于评估信息的混乱程度,也可以理解为某个分布的不均匀性(越不均匀熵越小,信息含量越高) 内容 import numpy as np # 计算序列的信息熵 def cal_entropy_arr(some_arr):some_arr = np.array(some_arr)value,counts = np.unique(some_arr, return_counts

    2021/12/28 14:08:00 人评论 次浏览
共57记录«上一页1234下一页»
扫一扫关注最新编程教程