中国大学MOOC《商业智能与Web智能(广东外语外贸大学)》最新章节测试答案

注意事项:
如支付后未自动显示完整内容,可点击“已支付?点此查询订单”进行查看。
如遇内容不符或缺失,请联系内容作者或平台客服(工作日 9:00-18:00)。

第1章 数据整理 正则表达式练习

1、 问题:能够在字符串“aabaaabaaaab”中匹配“aab”,而不能匹配“aaab”和“aaaab”的正则表达式包括
选项:
A:“a?b”
B:“a{,2}b”
C:“aa??b”
D:“aaa??b”
答案: “aa??b”

2、 问题:能够完全匹配字符串“(010)-62661617”和字符串“01062661617”的正则表达式包括
选项:
A:“(?\d{3})?-?\d{8}”
B:“[0-9()-]+”
C:“[(]?\d[)-]\d”
D:“[0-9(-)]\d”
答案: “(?\d{3})?-?\d{8}”;
“[0-9()-]+”;
“[(]?\d[)-]\d”

3、 问题:能够完全匹配字符串“c:\rapidminer\lib\plugs”的正则表达式包括
选项:
A:“c:\rapidminer\lib\plugs”
B:“c:\rapidminer\lib\plugs”
C:“(?i)C:\RapidMiner\Lib\Plugs”
D:“(?s)C:\RapidMiner\Lib\Plugs”
答案: “c:\rapidminer\lib\plugs”;
“(?i)C:\RapidMiner\Lib\Plugs”

4、 问题:能够完全匹配字符串“back”和“back-end”的正则表达式包括
选项:
A:“\w{4}-\w{3}|\w{4}”
B:“\w{4}|\w{4}-\w{3}”
C:“\S+-\S+|\S+”
D:“\w\b-\b\w|\w”
答案: “\w{4}-\w{3}|\w{4}”;
“\S+-\S+|\S+”;
“\w\b-\b\w|\w”

5、 问题:能够完全匹配字符串“go go”和“kitty kitty”,但不能完全匹配“go kitty”的正则表达式包括
选项:
A:“\b(\w+)\b\s+\1\b”
B:“\w{2,5}\s\1”
C:“(\S+) \s+\1”
D:“(\S{2,5})\s{1,}\1”
答案: “\b(\w+)\b\s+\1\b”;
“(\S{2,5})\s{1,}\1”

6、 问题:观察下面双引号内的两段文本(1)“中文名 贝拉克·侯赛因·奥巴马 外文名 Barack Hussein Obama II 别 名 欧巴马 国 籍 美国 民 族 德裔族 出生地 美国夏威夷州檀香山 出生日期 1961年8月4日 职 业 政治家、律师、总统 毕业院校 哥伦比亚大学,哈佛大学 信 仰 新教 主要成就 1996年伊利诺伊州参议员 主要成就 美国第56届、57届总统 2009年诺贝尔和平奖获得者 时代周刊年度风云人物 2008、2011 任期内清除本·拉登 代表作品 《我相信变革》《我父亲的梦想》《无畏的希望》 所属政党 美国民主党 血 型 AB型 学 院 西方学院 妻 子 米歇尔·拉沃恩·奥巴马 性 别 男”;(2)“中文名 唐纳德·特朗普 外文名 Donald Trump 别 名 Donald John Trump、川普 国 籍 美国 民 族 德意志人 出生日期 1946年6月14日 职 业 政治家、企业家、房地产商人、电视人 毕业院校 宾夕法尼亚大学沃顿商学院、纽约军事学院 代表作品 做生意的艺术、学徒 出生地 美国纽约 主要成就 第45任美国总统(2017年1月20日-2021年1月20日) 《时代周刊》2016年度人物 所属政党 美国共和党 净资产 21亿美元(2020年4月) 身 高 190 cm“。请严格按照答案填写要求回答下面5道填空题,包括本题。注意汉字占一个字符。当使用正则表达式“中文名[填空]”([填空]处填写11个字符,表达式尽可能通用,只能使用圆括号、\s\S这两个元字符和+?这两个重复元字符)分别抽取奥巴马和特朗普的中文名时,替换字符串“$1”的赋值为需要抽取的中文名。
答案: \s+(\S+)\s+

7、 问题:当使用正则表达式“外文名[填空]”([填空]处填写12个字符,表达式尽可能通用,只能使用圆括号、汉字、.\s这两个元字符和+?这两个重复元字符)分别抽取奥巴马和特朗普的外文名时,替换字符串“$1”的赋值为需要抽取的外文名。
答案: \s+(.+?)\s+别

8、 问题:使用正则表达式“职[填空]”([填空]处填写19个字符,表达式尽可能通用,只能使用圆括号、汉字、.\s这两个元字符和+?这两个重复元字符)分别抽取奥巴马和特朗普的职业时,替换字符串“$1”的赋值为需要抽取的职业。
答案: \s+业\s+(.+?)\s+毕业院校

9、 问题:当使用正则表达式“出生日期[填空]”([填空]处填写11个字符,表达式尽可能通用,只能使用圆括号、\s\S这两个元字符和+?这两个重复元字符)分别抽取奥巴马和特朗普的出生日期时,替换字符串“$1”的赋值为需要抽取的出生日期。
答案: \s+(\S+)\s+

10、 问题:使用正则表达式“民[填空]”([填空]处填写17个字符,表达式尽可能通用,只能使用圆括号、汉字、.\s这两个元字符和+?这两个重复元字符)分别抽取奥巴马和特朗普的民族时,替换字符串“$1”的赋值为需要抽取的民族。
答案: \s+族\s+(.+?)\s+出生

第4章 信用风险评分方法 代价敏感贝叶斯分类器练习

1、 问题:读入单元测试数据中的all_cust.xls文件,其中Churn设定为分类任务的label角色,Customer_ID设定为id角色,一共有个常规数值属性。
答案: 16

2、 问题:将所有数值属性进行基于熵的离散化预处理,仅剩下个常规角色的标称属性。
答案: 6

3、 问题:根据流失类(其值为1)的分类代价在10折交叉验证中最小化的原则,其中将流失类(1)预测为非流失类(0)的代价为30,将非流失类(0)预测为流失类(1)的代价为1,其余代价为0,交叉验证的随机种子设置为1,则设定confidence(1)的阈值为(保留三位小数,注意粒度为千分之一)。当confidence(1)的数值≥该阈值时将未知记录归类为流失类。保存朴素贝叶斯模型(文件名自己定义),供下面的填充题使用。
答案: 0.016

4、 问题:读入单元测试数据中的target_cust.csv文件,其中Churn设定为label角色,Customer_ID设定为id角色,应用上题中保存的朴素贝叶斯模型。根据“confidence(1)的数值≥上题中确定的阈值”生成预测

剩余70%内容付费后可查看
看完了?还不过瘾?点此向作者提问