非参大作业:针对不同群体设计不同特性的相机产品
组长 略
文献简述及初步探索
李克特量表
1、总体分布情况
图 1
度量 c01-c05,c11-c16 的得分情况,将每一份问卷的得分相加,得到总分 score,整体
情况如图 1.从图中可以看出,量表总分绝大部分分布在“普通”(3 ×11 = 33) 右侧,即群体态度
倾向于积极。群体量表总分均值为 41,标准差为 。(Rcode 1)
2、因子分析
Total Variance Explained
Initial Eigenvalues
Extraction Sums of Squared
Loadings
Rotation Sums of Squared
Loadings
Compon
ent
Total
% of
Variance
Cumulativ
e % Total
% of
Variance
Cumulativ
e % Total
% of
Variance
Cumulativ
e %
1
2
3
4 .881
5 .798
dimension0
6 .711
3、分类情况概览(用 rpart 包做决策树)(Rcode 2)
为了解对不同相机特性的重视程度和职业的关系,抽样 420 个数据记录作为训练集,用
剩下 449 个数据记录作为测试集,进行了回归树分析,得到的初步分类为下图所示:
测试的结果为:
>table(predict(kyphosis,kyphosis1,type="class"),camera[tsamp,19])
1 2 3 4
1 15 18 12 10
2 41111 6756
3 5 22 20 10
4 10 20 17 15
误分率为 64%
7 .545
8 .466
9 .400
10 .293
11 .113
Extraction Method: Principal Component Analysis.
从决策树中可以大致看出每种职业的偏好特点情况:
·1 代表学生:学生群体的特点:往往处在左向树枝的末端,意味着学生往往对于相机的各个
参数都很看重,属于非常敏感的群体;
·2 代表企业大经理:企业大经理的位置分布较广,可以认为群体内的差异比较大,没有非常
统一的敏感特点;
·3 代表一般行政:这个群体比较明显的一个特征是,有一部分人非常看重定时拍摄,但对任
意角度拍摄并不敏感
·4 代表专业技术:该群体在下图的最右支这部分人群较为重视相机可上网的功能,这一点比
较值得关注。
下表为全数据进行得回归树分析:(Rcode 3)
描述统计
一、 不同职业的人对外观的重视程度
1、轻薄短小,携带方便
2、新潮、很绚
3、多样化颜色
4、搭配流行的造型图案
在外观的选择上,不同职业人群的偏好大体相同。其中,对“新潮、很炫”这一外观特性
普遍持重视态度,而对其它外观特征,持普通和重视态度的人群比例大体相同并且均较高。
二、 不同职业的人对功能的重视程度
1、简单的操作方式,只要按一个键就能拍摄
2、连动拍摄(1 秒 20 张)
3、任意角度拍摄
4、定时拍摄
5、可更换镜头
6、可接三角架
7、可上网
在功能的选择上,不同职业人群的偏好也大体相同。其中,对“操作简单、联动拍摄、
任意角度拍摄”这三种功能特性普遍持相当重视的态度,而对其它四种功能特征,持普通态
度的人群比例最高。
三、 不同性别对相机外观的重视程度
1、轻薄短小,携带方便
2、新潮、很绚
3、多样化颜色
4、搭配流行的造型图案
对外观选择方面,男女偏好大体一致。其中,两者均对“新潮、很炫”这一外观特性持重
视态度,其他三个方面的外观特性持普通与重视态度的人群比例大致相同且均较高。
四、 不同性别对相机功能的重要程度
1、简单的操作方式,只要按一个键就能拍摄
2、连动拍摄(1 秒 20 张)
3、任意角度拍摄
4、定时拍摄
5、可更换镜头
6、可接三角架
7、可上网
在功能的选择上,不同性别的人群偏好也大体相同。其中,对“操作简单、联动拍摄、
任意角度拍摄”这三种功能特性普遍持相当重视的态度,而对其它四种功能特征,持普通态
度和重视态度的人群比例均较高。
五、 不同性别对价格的可接受程度
对价格的可接受程度,男性普遍能接受较高价格,而女性倾向于较低价格。其中,男性
能接受的价格集中在 1000-3000 左右,而女性能接受的价格集中在 2000 以下。
六、 不同职业对价格的可接受程度
对价格的可接受程度,不同职业的人群有较大差异。其中,专业技术人员能接受的价格
最高;一般行政人员和企业大堂经理能接受的价格最低,基本集中在 2000 以内;学生的可
接受价格处于中间水平,普遍集中在 1000-2000 元之间。
综上所述,不同职业和不同性别的人群对相机外观和功能的偏好大致相同。其中,在外
观上,人们普遍对“新潮、很炫”比较看重;在功能上,人们普遍对“操作简单、联动拍摄、
任意角度拍摄”相当重视。
在价格的可接受程度上,不同职业和不同性别的人群有较大差异。其中,性别方面,男
性可接受的价格高于女性;职业方面,专业技术人员可接受的价格最高,其次为学生,一般
行政人员和企业大堂经理可接受价格最低。
不同职业的人对于相机各属性重视程度的比较
由之前的描述统计结果可以看到男女对于相机属性的偏好各不相同,因此为了更好的了
解不同职业的人偏好的不同,我们首先将总体分男女进行区分,然后分别对男性和女性不同
职业的人群做其对不同相机属性重视程度的 Ridit 检验。
H0:所考察人群对于各属性的重视程度无轻重之分
H1:所考察人群对于各属性的重视程度有轻重之分
不同职业人群对于携带方便特性(C01)的重视程度列联表(男性)
不同职业人群对于携带方便特性(C01)的重视程度列联表(女性)
重视度
职业
非常不重视 不重视 普通 重视 非常重视
学生 0 1 7 5 0
企业大堂经理 7 35 125 120 39
一般行政 4 26 73 69 21
专业技术 1 1 9 8 2
重视度
职业
非常不重视 不重视 普通 重视 非常重视
学生 4 24 58 52 7
企业大堂经理 0 0 0 2 0
一般行政 0 0 8 7 1
专业技术 4 25 62 46 16
不同职业人群对于携带方便特性(C01)的重视程度 Ridit 值 95%置信区间图(左男右
女下整体)
不同职业人群对于新潮特性(C02)的重视程度 Ridit95%值置信区间图(左男右女下整
体)
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
不同职业人群对于多样化颜色特性(C03)的重视程度 Ridit 值 95%置信区间图(左男右女
下整体)
不同职业人群对于流行造型图案特性(C04)的重视程度 Ridit 值 95%置信区间图(左男右
女下整体)
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
不同职业人群对于简单操作方式特性(C05)的重视程度 Ridit 值 95%置信区间图(左男右
女下整体)
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
不同职业人群对于连动拍摄特性(C11)的重视程度 Ridit 值 95%置信区间图(左男右女下
整体)
不同职业人群对于任意角度拍摄特性(C12)的重视程度 Ridit 值 95%置信区间图(左男右
女下整体)
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
不同职业人群对于定时拍摄特性(C13)的重视程度 Ridit 值 95%置信区间图(左男右女下
整体)
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
0.
0
0.
2
0.
4
0.
6
0.
8
1.
0
Ridit value confidence inetrval
group
R
s
co
re
不同职业人群对于可更换镜头特性(C14)的重视程度 Ridit 值 95%置信区间图(左男右女
下整体)
不同职业人群对于可接三角架特性(C15)的重视程度 Ridit 值 95%置信区间图(左男右女
下整体)
不同职业人群对于可上网特性(C16)的重视程度 Ridit 值 95%置信区间图(左男右女下整
体)
汇总表如下:
属性 男 女 整体
C02 对职业一重要性低 对职业一重要性低
C11 对职业二重要性高
对职业三重要性低
对职业二重要性高
C12 对职业二重要性高
对职业三重要性低
对职业二重要性高
C13 对职业二重要性高
对职业三重要性低
对职业二重要性高,
职业四重要性低
C14 对职业三重要性高 对职业三重要性低
C15 对职业二重要性高
对职业三重要性低
对职业二重要性高
C16 对职业二重要性高
对职业三重要性低
对职业三重要性低
不同职业人群对相机属性重视程度的关联规则分析
关联规则
先对数据处理 整理成 2 元数据,只选取了其中部分变量如下:
c01 c02 c03 c04 c05 c11 c12 c13 c14 c15 c16
其中 c01 到 c16 为对相机的特性重视程度,包括外观和性能,处理办法是把重视和非常重视
设为 1,普通,不重视和非常不重视设为 0
d1 为性别 转化后 0 表示男性 1 表示女性
下面转化成函数包能处理的 transaction 形式
cameranew1=(cameranew1); trans2 <- as(cameranew1, "transactions");
转化后数据情况大致如下
summary(trans2)
从中大概可以看出最受重视的因素有 c12,c11,c05,c02,这点从下面的频率图中也可以看
出
itemFrequencyPlot(trans2, support = , = ) #图
分性别:
按 lift 由大到小排序的。可以看出女性依次更重视 c03,c01,c13,c05,c15,c12,c04,
c02 这些提升度均大于 1,意味着女性倾向于重视这些因素。但有意思的是 d1——c14 和 d1
到 c15 的提升度是小于 1 的,也就意味着没有先验信息是重视 c14 和 c16 的概率要大于女性
重视这两个因素的比例,所以针对女性相机这两个特性可以不做重点宣传和打造的。
分职业:
将总体按照职业的不同分为四大类,分别对于相机外观和配置供 11 个属性进行关联分
析,根据提升度这一指标分析不同人群重视相机属性的关联效应。这对于相机厂商针对目标
人群的相机整体设计具有指导意义。
取支持度大于 ,置信度在 以上,提升度在 以上的关联项输出如下:
学生:
企业大堂经理:
一般行政:
专业技术:
结论
描述统计阶段的分析表明:
在相机外观和功能方面,不同职业和不同性别的人群的重视程度有细微差别。其中,在
外观上,人们普遍对“新潮、很炫”比较看重;在功能上,人们普遍对“操作简单、联动拍摄、
任意角度拍摄”相当重视。
在价格的可接受程度上,不同职业和不同性别的人群有较大差异。其中,性别方面,男
性可接受的价格高于女性;职业方面,专业技术人员可接受的价格最高,其次为学生,一般
行政人员和企业大堂经理可接受价格最低。
Rdit 检验结果表明:
于学生来说,对不太重视轻薄短小,携带方便这一特性,其他特性的显著性没有通过
对于企业大堂经理来说,c11 到 c15 的特性重视度都很高,及可以针对此人群设计连动
拍摄(1 秒 20 张)、任意角度拍摄、定时拍摄、可更换镜头和可接三角架性能好的相机。
对于一般行政人员来说,男性的特点是对可更换镜头比较重视,女性一般行政人员从结
果上看对很多特性都不是很重视,针对以上这些可以对男性一般行政人员设计可更换镜
头较好的相机,对女性一般行政人员设计一般化产品即可。
对于专业技术人员来说,上述检验没有检验出很多显著的特点,需要注意的是专业技术
人员对定时拍摄重视度低,所以针对这类人群的相机定时拍摄功能一般化即可。
总的来看,人们对于相机属性的重视度的关联主要集中于相机的技术配置,而不是外观
关联规则结果表明:
于学生来说,重视“定时拍对摄”特性的同时也会同时重视“连动拍摄”和“任意角度拍
摄”,同时注意到“连动拍摄”和“任意角度拍摄”特性也是相互关联的,因此针对此类人
群的同一产品中这三个特性最好兼顾
对于企业大堂经理来说,属性间的关联因素很多,较为明显的有“连动拍摄”、“任意角度
拍摄”、“定时拍摄”间,以及“任意角度拍摄”、“定时拍摄”同“可更换镜头”、“可接三角架”
之间的关联,说明以上五个属性最好同时在针对此类人群的设计中体现
对于一般行政人员来说,“连动拍摄”属性和“任意角度拍摄”属性相互关联,因此针对此
类人群的同一产品中“连动拍摄”属性和“任意角度拍摄”可以同时体现。
对于专业技术人员来说,“连动拍摄”属性和“任意角度拍摄”属性相互关联,因此针对此
类人群的同一产品中“连动拍摄”属性和“任意角度拍摄”可以同时体现。
总的来看,人们对于相机属性的重视度的关联主要集中于相机的技术配置,而不是外观
综上所述,本文主要正对不同职业对相机不同特性重视程度的差异。经过以上分析知,
不同职业间人群确实存在差异,总体而言企业大堂经理重视的特性最多,这类顾客是最挑剔
的,但是其心理价位却不高,相比而言对于学生群体和专业技术人员,主要重视的是相机的
功能,心理价位较高,可以重点突破。与此同时,针对一般行政人员可以采取一般化产品的
推广即可。
程序附录
文献综述及数据初探部分
Rcode 1:
camera=("C:\\Users\\MacX\\Desktop\\",header=T)
attach(camera)
v=which((camera),=TRUE) ##检测缺失值(输出结果无缺失值)
a=matrix(c(c01,c02,c03,c04,c05,c11,c12,c13,c14,c15,c16),nrow=869,ncol=11)
score=NA
for(i in 1:869)
{score=c(score,sum(a[i,]))
}
hist(score,prob=TRUE,ylim=c(0,),xlim=c(10,60))
lines(density(score))
rug(jitter(score))
Rcode 2:
m=869
(10)
samp=c(sample(1:200,100),sample(201:400,100),sample(401:600,100),sample(601:869,120))
tsamp=setdiff(1:m,samp)
kyphosis=rpart(factor(d3)~factor(c01)+factor(c02)+factor(c03)+factor(c04)+factor(c05)+factor(c1
1)+factor(c12)+factor(c13)+factor(c14)+factor(c15)+factor(c16),data=camera,subset=samp)
kyphosis
plot(kyphosis)
text(kyphosis,=T,xpd=T)
library()
(kyphosis)
kyphosis1=camera[tsamp,]
predict(kyphosis,kyphosis1,type="class")
table(predict(kyphosis,kyphosis1,type="class"),camera[tsamp,19])
Rcode 3
stu=a[which(d3==1),]
library(rpart)
fit=rpart(factor(d3)~factor(c01)+factor(c02)+factor(c03)+factor(c04)+factor(c05)+factor(c11)+fac
tor(c12)+factor(c13)+factor(c14)+factor(c15)+factor(c16),data=camera)
plot(fit);text(fit,=T,xpd=T)
(fit)
描述统计部分:
data=("",header=T)
attach(data)
par(mfrow=c(1,2)) #不同性别对外观重要性的箱线图
for(i in 1:2)
boxplot(c01[d1==i],c02[d1==i],c03[d1==i],c04[d1==i],main=rownames()[i])
for(i in 1:2) #不同性别对功能重要性的箱线图
boxplot(c05[d1==i],c11[d1==i],c12[d1==i],c13[d1==i],c14[d1==i],c15[d1==i],
c16[d1==i],main=rownames()[i])
#性别对外观&功能重要程度,列联表,条形图
=matrix(rep(0,10),nrow=2,dimnames=list(c("男","女"),
c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:2)
for(j in 1:5)
[i,j]=sum(d1==i & c01==j)
par(mfrow=c(1,2))
for(i in 1:2)
barplot([i,],main=rownames()[i])
=matrix(rep(0,10),nrow=2,dimnames=list(c("男","女"),
c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:2)
for(j in 1:5)
[i,j]=sum(d1==i & c02==j)
par(mfrow=c(1,2))
for(i in 1:2)
barplot([i,],main=rownames()[i])
=matrix(rep(0,10),nrow=2,dimnames=list(c("男","女"),
c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:2)
for(j in 1:5)
[i,j]=sum(d1==i & c03==j)
par(mfrow=c(1,2))
for(i in 1:2)
barplot([i,],main=rownames()[i])
=matrix(rep(0,10),nrow=2,dimnames=list(c("男","女"),
c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:2)
for(j in 1:5)
[i,j]=sum(d1==i & c04==j)
par(mfrow=c(1,2))
for(i in 1:2)
barplot([i,],main=rownames()[i])
=matrix(rep(0,10),nrow=2,dimnames=list(c("男","女"),
c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:2)
for(j in 1:5)
[i,j]=sum(d1==i & c05==j)
par(mfrow=c(1,2))
for(i in 1:2)
barplot([i,],main=rownames()[i])
=matrix(rep(0,10),nrow=2,dimnames=list(c("男","女"),
c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:2)
for(j in 1:5)
[i,j]=sum(d1==i & c11==j)
par(mfrow=c(1,2))
for(i in 1:2)
barplot([i,],main=rownames()[i])
=matrix(rep(0,10),nrow=2,dimnames=list(c("男","女"),
c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:2)
for(j in 1:5)
[i,j]=sum(d1==i & c12==j)
par(mfrow=c(1,2))
for(i in 1:2)
barplot([i,],main=rownames()[i])
=matrix(rep(0,10),nrow=2,dimnames=list(c("男","女"),
c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:2)
for(j in 1:5)
[i,j]=sum(d1==i & c13==j)
par(mfrow=c(1,2))
for(i in 1:2)
barplot([i,],main=rownames()[i])
=matrix(rep(0,10),nrow=2,dimnames=list(c("男","女"),
c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:2)
for(j in 1:5)
[i,j]=sum(d1==i & c14==j)
par(mfrow=c(1,2))
for(i in 1:2)
barplot([i,],main=rownames()[i])
=matrix(rep(0,10),nrow=2,dimnames=list(c("男","女"),
c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:2)
for(j in 1:5)
[i,j]=sum(d1==i & c15==j)
par(mfrow=c(1,2))
for(i in 1:2)
barplot([i,],main=rownames()[i])
=matrix(rep(0,10),nrow=2,dimnames=list(c("男","女"),
c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:2)
for(j in 1:5)
[i,j]=sum(d1==i & c16==j)
par(mfrow=c(1,2))
for(i in 1:2)
barplot([i,],main=rownames()[i])
par(mfrow=c(2,2)) #不同职业对外观重要性的箱线图
for(i in 1:4)
boxplot(c01[d3==i],c02[d3==i],c03[d3==i],c04[d3==i],main=rownames()[i])
for(i in 1:4)
boxplot(c05[d3==i],c11[d3==i],c12[d3==i],c13[d3==i],c14[d3==i],c15[d3==i],
c16[d3==i],main=rownames()[i])
#列联表画条形图_不同职业对外观和功能的重视程度
=matrix(rep(0,20),nrow=4,dimnames=list(c("学生","企业大堂经理",
"一般行政","专业技术"),c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:4)
for(j in 1:5)
[i,j]=sum(d3==i & c01==j)
par(mfrow=c(2,2))
for(i in 1:4)
barplot([i,],main=rownames()[i])
=matrix(rep(0,20),nrow=4,dimnames=list(c("学生","企业大堂经理",
"一般行政","专业技术"),c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:4)
for(j in 1:5)
[i,j]=sum(d3==i & c02==j)
par(mfrow=c(2,2))
for(i in 1:4)
barplot([i,],main=rownames()[i])
=matrix(rep(0,20),nrow=4,dimnames=list(c("学生","企业大堂经理",
"一般行政","专业技术"),c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:4)
for(j in 1:5)
[i,j]=sum(d3==i & c03==j)
par(mfrow=c(2,2))
for(i in 1:4)
barplot([i,],main=rownames()[i])
=matrix(rep(0,20),nrow=4,dimnames=list(c("学生","企业大堂经理",
"一般行政","专业技术"),c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:4)
for(j in 1:5)
[i,j]=sum(d3==i & c04==j)
par(mfrow=c(2,2))
for(i in 1:4)
barplot([i,],main=rownames()[i])
=matrix(rep(0,20),nrow=4,dimnames=list(c("学生","企业大堂经理",
"一般行政","专业技术"),c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:4)
for(j in 1:5)
[i,j]=sum(d3==i & c05==j)
par(mfrow=c(2,2))
for(i in 1:4)
barplot([i,],main=rownames()[i])
=matrix(rep(0,20),nrow=4,dimnames=list(c("学生","企业大堂经理",
"一般行政","专业技术"),c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:4)
for(j in 1:5)
[i,j]=sum(d3==i & c11==j)
par(mfrow=c(2,2))
for(i in 1:4)
barplot([i,],main=rownames()[i])
=matrix(rep(0,20),nrow=4,dimnames=list(c("学生","企业大堂经理",
"一般行政","专业技术"),c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:4)
for(j in 1:5)
[i,j]=sum(d3==i & c12==j)
par(mfrow=c(2,2))
for(i in 1:4)
barplot([i,],main=rownames()[i])
=matrix(rep(0,20),nrow=4,dimnames=list(c("学生","企业大堂经理",
"一般行政","专业技术"),c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:4)
for(j in 1:5)
[i,j]=sum(d3==i & c13==j)
par(mfrow=c(2,2))
for(i in 1:4)
barplot([i,],main=rownames()[i])
=matrix(rep(0,20),nrow=4,dimnames=list(c("学生","企业大堂经理",
"一般行政","专业技术"),c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:4)
for(j in 1:5)
[i,j]=sum(d3==i & c14==j)
par(mfrow=c(2,2))
for(i in 1:4)
barplot([i,],main=rownames()[i])
=matrix(rep(0,20),nrow=4,dimnames=list(c("学生","企业大堂经理",
"一般行政","专业技术"),c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:4)
for(j in 1:5)
[i,j]=sum(d3==i & c15==j)
par(mfrow=c(2,2))
for(i in 1:4)
barplot([i,],main=rownames()[i])
=matrix(rep(0,20),nrow=4,dimnames=list(c("学生","企业大堂经理",
"一般行政","专业技术"),c("非常不重视","不重视","普通","重视","非常重视")))
for(i in 1:4)
for(j in 1:5)
[i,j]=sum(d3==i & c16==j)
par(mfrow=c(2,2))
for(i in 1:4)
barplot([i,],main=rownames()[i])
=matrix(rep(0,10),nrow=2,byrow=T,dimnames=list
(c("男","女"),c("<=1000","1001-2000","2001-3000","3001-6000",">6000")))
for(i in 1:2)
for(j in 1:5)
[i,j]=sum(d1==i & a03==j)
for(i in 1:2)
barplot([i,],main=rownames()[i])
par(mfrow=c(1,1))
boxplot(a03[d1==1],a03[d1==2])
=matrix(rep(0,20),nrow=4,dimnames=list(c("学生","企业大堂经理",
"一般行政","专业技术"),c("<1000","1000-2000","2000-3000","3000-6000",">6000")))
for(i in 1:4) #职业、价格列联表
for(j in 1:5)
{
[i,j]=sum(d3==i & a03==j)
}
par(mfrow=c(2,2))
for(i in 1:4)
barplot([i,],main=rownames()[i])
boxplot(a03[d3==1],a03[d3==2],a03[d3==3],a03[d3==4])
Ridit 检验部分:
#Ridit 检验函数,主要是算出 W 值,求出 p 值,并且输出置信区间,看重复程度,检验函
数如下:
=function(x)
{
O=sum(x) #先求出几个 O.., r 和 s
r=nrow(x)
s=ncol(x)
H=*apply(x,2,sum) #求 H、Rj
C=rep(0,s)
for(i in 2:s){C[i]=2*sum(H[1:i-1])}
N=H+C
=N/O
=apply(x,1,sum) #求行和
=apply(x,2,sum) #求列和
##计算 Ri
R=matrix(rep(0,r*s),nrow=r,ncol=s)
for(i in 1:r)
for(j in 1:s)
{
R[i,j]=x[i,j]/[j]*[j]
}
=apply(R,1,sum)
##计算 Ridit 得分矩阵
Rid=matrix(rep(0,r*s),nrow=r)
for(i in 1:r){Rid[i,]=*x[i,]}
##计算各处理的秩平均
Ri_bar=rep(0,s)
for(i in 1:r){Ri_bar[i]=sum(Rid[i,])/[i]}
##求平均 Ridit 的置信区间
=matrix(rep(0,2*r),nrow=r)
for(i in 1:r){[i,]=c(Ri_bar[i]-1/sqrt(3*[i]),Ri_bar[i]+1/sqrt(3*[i]))}
dimnames()=list(NULL,c("置信下限","置信上限"))
##作图
plot(rep(1,100),seq([1,1],[1,2],length=100),
type="l",main="Ridit value confidence inetrval",
xlab="group",ylab="R score",xlim=c(1,r),ylim=c(0,1))
for(i in 2:r)
{
lines(rep(i,100),seq([i,1],[i,2],length=100))
}
lines(c(0,r+1),c(,))
W=12*sum(*()^2) #计算检验统计量
pvalue=1-pchisq(W,r-1)
list("Ridit Score"=Rid,"秩平均"=Ri_bar,"置信区间"=,"p-value"=pvalue)
}
找出需要检验的部分,以矩阵形式输出:
camera=("e:\\ 学 习 \\ 课 件 \\ 大 三 上 \\ 非 参 数 统 计 \\ 各 章 数 据
\\",header=T)
malec01=femalec01=matrix(rep(0,20),4,5)
for(i in 1:4){for(j in 1:5)
{malec01[i,j]=sum(camera$d1==1&camera$d3==i&camera$c01==j)}}
for(i in 1:4){for(j in 1:5)
{femalec01[i,j]=sum(camera$d1==2&camera$d3==i&camera$c01==j)}}
#以 c01 和 c02 为例做 Ridit 检验
mc01=malec01+femalec01
(malec01)
(femalec01)
(mc01)
关联规则部分:
camera=('C:\\Documents and Settings\\Administrator\\桌面\\',head=T)
cameranew1=camera[,-c(1:5,18)]
ln1=length(cameranew1[1,])
for(i in 1:(ln1-2))
{
cameranew1[[i]][cameranew1[[i]]<=3]=0;
cameranew1[[i]][cameranew1[[i]]>3]=1;
}
cameranew1[[ln1-1]][cameranew1[ln1-1]==1]=0;
cameranew1[[ln1-1]][cameranew1[ln1-1]==2]=1;
cameranew1[[ln1]][cameranew1[ln1]==1]=1;
cameranew1[[ln1]][cameranew1[ln1]>=2]=0;
cameranew1
cameranew1=(cameranew1); trans2 <- as(cameranew1, "transactions");
summary(trans2)
summary( trans2)
itemFrequencyPlot(trans2, support = , = ) #图
rules = apriori(trans2, parameter = list(support = ,confidence = ,maxlen=2))#求规则
inspect(rules,subset=lift>)
names(rules)
x=subset(rules, subset = lhs %in% "d3" )
length(x)
inspect(x)
inspect(sort(x, by = "support")[1:length(x)])
inspect(sort(x, by = "confidence")[1:length(x)])
inspect(sort(x, by = "lift")[1:length(x)])