首 页 ┆ 源码下载 ┆ IT学院 ┆ 字体下载 ┆ 模板下载 ┆ 源码发布 ┆ 广告合作 ┆ 网站地图
► 设为首页
► 加入收藏
► 联系我们
源码下载 >> ASP源码 | PHP源码 | ASP.net源码 | JSP源码 | CGI源码 | VC/C++源码 | VB源码 | Delphi源码 | Flash源码
文章学院 >> 网络编程 | 网页设计 | 图形图象 | 数据库 | 服务器 | 网络媒体 | 网络安全 | 操作系统 | 办公软件 | 软件开发 | 黑客知识
字体下载 >> 精制字体 | 非英字体 | 艺术字体 | 著名字体 | 哥特式 | 简单字体 | 手写体 | 节假日 | 图案字体 | 精度像素 | 中文字体
模板下载 >> 企业门户 | 数码网络 | 休闲娱乐 | 影视音乐 | 旅游名胜 | 文化艺术 | 电子商务 | 个性展示 | 登陆导航 | Flash模板
►►您当前的位置:源码园 → IT学院 → 数据库 → 其他相关 → 文章内容

分拆统计字符串

作者:无从考证  来源:转载  发布时间:2007-2-7 12:09:04
在数据库表tbl1中有一个字段Keywords,它是nvarchar类型,长度为1000,该字段的内容是所要分析的论文的关键字
id                        keywords 
-----------------------------------------------------------
1                          kw1;kw2;kw3
2                          kw2;kw3
3                          kw3;kw1;kw4
问题1。
对于在keywords字段中出现的所有关键字集合(上例中关键字集合为{kw1,kw2,kw3,kw4})中的任意一个关键字,要统计它出现的次数(也就是包含该关键字的纪录的条数),然后写到另一张表中。最后的效果就是
keywords       count
-------------------------
kw1              2
kw2              2
kw3              3
kw4              1

问题2。
在此基础上,要进行组合查询。也就是说在整个关键字集合中任意抽出两个关键字,统计它们在数据库表纪录中同时出现的次数。对于上题,最后效果要是:
keywords             count
----------------------------------
kw1;kw2                1
kw1;kw3                2
kw1;kw4                1
kw2;kw3                2
kw2;kw4                0
kw3;kw4                1

--------------------------------------------------------------------------------------
--统计示例
--为统计处理专门做的序数表
select top 1000 id=identity(int,1,1) into 序数表 from syscolumns a,syscolumns b
alter table 序数表 add constraint pk_id_序数表 primary key(id)
go
--示例数据
create table tbl1(id int,keywords nvarchar(1000))
insert tbl1 select 1,’kw1;kw2;kw3’
union  all  select 2,’kw2;kw3’
union  all  select 3,’kw3;kw1;kw4’
go
--第一种统计(计数)
select keyword=substring(a.keywords,b.id,charindex(’;’,a.keywords+’;’,b.id)-b.id)
 ,[count]=count(distinct a.id)
from tbl1 a,序数表 b
where b.id<=len(a.keywords)
 and substring(’;’+a.keywords,b.id,1)=’;’
group by substring(a.keywords,b.id,charindex(’;’,a.keywords+’;’,b.id)-b.id)
go
--第二种统计(组合统计)
select keyword=substring(a.keywords,b.id,charindex(’;’,a.keywords+’;’,b.id)-b.id)
 ,[count]=count(distinct a.id),a.id
into #t
from tbl1 a,序数表 b
where b.id<=len(a.keywords)
 and substring(’;’+a.keywords,b.id,1)=’;’
group by substring(a.keywords,b.id,charindex(’;’,a.keywords+’;’,b.id)-b.id),a.id
select keyword=a.keyword+’;’+b.keyword,[count]=sum(case a.id when b.id then 1 else 0 end)
from #t a,#t b
where a.keyword<b.keyword
group by a.keyword,b.keyword
order by keyword
drop table #t
go
--删除测试环境
drop table tbl1,序数表
/*--测试结果
--统计1
keyword    count   
---------- --------
kw1        2
kw2        2
kw3        3
kw4        1
(所影响的行数为 4 行)

--统计2
keyword                 count      
----------------------- -----------
kw1;kw2                 1
kw1;kw3                 2
kw1;kw4                 1
kw2;kw3                 2
kw2;kw4                 0
kw3;kw4                 1
(所影响的行数为 6 行)
--*/
[] [返回上一页] [打 印]
  • 上一篇文章:PS层样式详解:混合选项(二)
  • 下一篇文章:更新字符串列表中,指定位置的字符串

  • 相关文章:
  • 分拆统计字符串
关于本站 - 网站帮助 - 广告合作 - 下载声明 - 友情连接 - 网站地图 - 源码发布
Copyright © 2003-2009 Ymyasp.Com. All Rights Reserved .
备案序号:粤ICP备07029071号