<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="en">
		<id>http://wiki.iiis.systems:9988/w/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Shenh10</id>
		<title>IIIS-Systems - User contributions [en]</title>
		<link rel="self" type="application/atom+xml" href="http://wiki.iiis.systems:9988/w/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Shenh10"/>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php/Special:Contributions/Shenh10"/>
		<updated>2026-04-05T08:26:52Z</updated>
		<subtitle>User contributions</subtitle>
		<generator>MediaWiki 1.24.0-rc.1</generator>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=People&amp;diff=423</id>
		<title>People</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=People&amp;diff=423"/>
				<updated>2016-11-17T03:55:40Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;* [[User:Liyi | 李艺]]&lt;br /&gt;
* [[User:Wangguosai | 王国赛]]&lt;br /&gt;
* [[User:Zhengshun | 郑顺]]&lt;br /&gt;
* [[User:HuLi| 李浒]]&lt;br /&gt;
* [[User:Shenhan| 申晗]]&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=User:Shenhan&amp;diff=422</id>
		<title>User:Shenhan</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=User:Shenhan&amp;diff=422"/>
				<updated>2016-11-17T03:54:55Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;=基本信息=&lt;br /&gt;
&lt;br /&gt;
姓名：申晗&lt;br /&gt;
&lt;br /&gt;
性别：女&lt;br /&gt;
&lt;br /&gt;
生日：1992年8月24日&lt;br /&gt;
&lt;br /&gt;
籍贯：湖南&lt;br /&gt;
&lt;br /&gt;
=教育背景=&lt;br /&gt;
&lt;br /&gt;
本科：2010-2015 清华大学电子工程系 电子科学与技术 学士&lt;br /&gt;
&lt;br /&gt;
研究生：清华大学交叉信息研究院计算机系统方向 硕士&lt;br /&gt;
&lt;br /&gt;
=联系方式=&lt;br /&gt;
&lt;br /&gt;
手机号：13051323330&lt;br /&gt;
&lt;br /&gt;
邮箱：shenhan1992@163.com&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
=研究方向=&lt;br /&gt;
室内定位，计算机视觉，分布式系统框架，SDN&lt;br /&gt;
&lt;br /&gt;
=研究项目=&lt;br /&gt;
* [[Projects:HadoopBenchmark | 虚拟环境下部署大数据系统框架的调度性能研究]]&lt;br /&gt;
* [[Projects:IndoorPositioning | 多人环境下基于WIFI的室内定位]]&lt;br /&gt;
* [[Projects:CVTracing | 图像追踪、避障及导航]]&lt;br /&gt;
&lt;br /&gt;
=个人主页=&lt;br /&gt;
&lt;br /&gt;
[https://github.com/shenh10 GitHub主页]&lt;br /&gt;
&lt;br /&gt;
[https://cn.linkedin.com/in/hanshe LinkedIn主页]&lt;br /&gt;
&lt;br /&gt;
=兴趣爱好=&lt;br /&gt;
&lt;br /&gt;
音乐，运动&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=User:Shenhan&amp;diff=421</id>
		<title>User:Shenhan</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=User:Shenhan&amp;diff=421"/>
				<updated>2016-11-17T03:54:27Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;=基本信息=&lt;br /&gt;
&lt;br /&gt;
姓名：申晗&lt;br /&gt;
&lt;br /&gt;
性别：女&lt;br /&gt;
&lt;br /&gt;
生日：1992年8月24日&lt;br /&gt;
&lt;br /&gt;
籍贯：湖南&lt;br /&gt;
&lt;br /&gt;
=教育背景=&lt;br /&gt;
&lt;br /&gt;
本科：2010-2015 清华大学电子工程系 电子科学与技术 学士&lt;br /&gt;
&lt;br /&gt;
研究生：清华大学交叉信息研究院计算机系统方向 硕士&lt;br /&gt;
&lt;br /&gt;
=联系方式=&lt;br /&gt;
&lt;br /&gt;
手机号：13051323330&lt;br /&gt;
&lt;br /&gt;
邮箱：shenhan1992@163.com&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
=研究方向=&lt;br /&gt;
分布式系统框架，SDN&lt;br /&gt;
室内定位，计算机视觉&lt;br /&gt;
&lt;br /&gt;
=研究项目=&lt;br /&gt;
* [[Projects:HadoopBenchmark | 虚拟环境下部署大数据系统框架的调度性能研究]]&lt;br /&gt;
* [[Projects:IndoorPositioning | 多人环境下基于WIFI的室内定位]]&lt;br /&gt;
* [[Projects:CVTracing | 图像追踪、避障及导航]]&lt;br /&gt;
&lt;br /&gt;
=个人主页=&lt;br /&gt;
&lt;br /&gt;
[https://github.com/shenh10 GitHub主页]&lt;br /&gt;
&lt;br /&gt;
[https://cn.linkedin.com/in/hanshe LinkedIn主页]&lt;br /&gt;
&lt;br /&gt;
=兴趣爱好=&lt;br /&gt;
&lt;br /&gt;
音乐，运动&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=User:Shenhan&amp;diff=420</id>
		<title>User:Shenhan</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=User:Shenhan&amp;diff=420"/>
				<updated>2016-11-17T03:52:35Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: Created page with &amp;quot;=基本信息=  姓名：申晗  性别：女  生日：1992年8月24日  籍贯：湖南  =教育背景=  本科：2010-2015 清华大学电子工程系 电子科学与技术...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;=基本信息=&lt;br /&gt;
&lt;br /&gt;
姓名：申晗&lt;br /&gt;
&lt;br /&gt;
性别：女&lt;br /&gt;
&lt;br /&gt;
生日：1992年8月24日&lt;br /&gt;
&lt;br /&gt;
籍贯：湖南&lt;br /&gt;
&lt;br /&gt;
=教育背景=&lt;br /&gt;
&lt;br /&gt;
本科：2010-2015 清华大学电子工程系 电子科学与技术 学士&lt;br /&gt;
&lt;br /&gt;
研究生：清华大学交叉信息研究院计算机系统方向 硕士&lt;br /&gt;
&lt;br /&gt;
=联系方式=&lt;br /&gt;
&lt;br /&gt;
手机号：13051323330&lt;br /&gt;
&lt;br /&gt;
邮箱：shenhan1992@163.com&lt;br /&gt;
&lt;br /&gt;
=个人主页=&lt;br /&gt;
&lt;br /&gt;
[https://github.com/shenh10 GitHub主页]&lt;br /&gt;
&lt;br /&gt;
[https://cn.linkedin.com/in/hanshe LinkedIn主页]&lt;br /&gt;
&lt;br /&gt;
=兴趣爱好=&lt;br /&gt;
&lt;br /&gt;
音乐，运动&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=User:Shenh10&amp;diff=419</id>
		<title>User:Shenh10</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=User:Shenh10&amp;diff=419"/>
				<updated>2016-11-17T03:46:54Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: Blanked the page&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=Projects&amp;diff=418</id>
		<title>Projects</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=Projects&amp;diff=418"/>
				<updated>2016-11-17T03:45:22Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;* [[Projects:project_test | 项目示例]]&lt;br /&gt;
* [[Projects:Owan | 光交换广域网]]&lt;br /&gt;
* [[Projects:Stateless-DCN | 无状态数据中心网络]]&lt;br /&gt;
* [[Projects:Stock-Prediction | 多数据源股市预测]]&lt;br /&gt;
* [[Projects:CIDS | CIDS:Adapting legacy intrusion detection system to the cloud with hybrid sampling]]&lt;br /&gt;
* [[Projects:HadoopBenchmark | 虚拟环境下部署大数据系统框架的调度性能研究]]&lt;br /&gt;
* [[Projects:IndoorPositioning | 多人环境下基于WIFI的室内定位]]&lt;br /&gt;
* [[Projects:CVTracing | 图像追踪、避障及导航]]&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=Projects:CVTracing&amp;diff=417</id>
		<title>Projects:CVTracing</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=Projects:CVTracing&amp;diff=417"/>
				<updated>2016-11-17T03:44:07Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: Created page with &amp;quot;= 项目名称 = 图像追踪、避障与导航  = 项目介绍 = 应用深度学习到壁障追踪，并将图像追踪避障等算法用于无人机导航  = 参与人员 =...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= 项目名称 =&lt;br /&gt;
图像追踪、避障与导航&lt;br /&gt;
&lt;br /&gt;
= 项目介绍 =&lt;br /&gt;
应用深度学习到壁障追踪，并将图像追踪避障等算法用于无人机导航&lt;br /&gt;
&lt;br /&gt;
= 参与人员 =&lt;br /&gt;
申晗，马文硕，贾志鹏&lt;br /&gt;
&lt;br /&gt;
指导导师: 黄铃，徐葳&lt;br /&gt;
&lt;br /&gt;
= 相关资料 =&lt;br /&gt;
&lt;br /&gt;
= 项目进展 =&lt;br /&gt;
== 2016年10月8日 ==&lt;br /&gt;
开始对图像追踪的研究&lt;br /&gt;
== 2016年11月3日 ==&lt;br /&gt;
完成对非DL和DL算法：MEEM, KCF, SDCRF, Muster, MDNet, Siamese等的调研&lt;br /&gt;
&lt;br /&gt;
== 2016年11月16日 ==&lt;br /&gt;
完成Vot2015 与obt100 benchmark的准备&lt;br /&gt;
&lt;br /&gt;
= 相关链接 =&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=Projects&amp;diff=416</id>
		<title>Projects</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=Projects&amp;diff=416"/>
				<updated>2016-11-17T03:37:03Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;* [[Projects:project_test | 项目示例]]&lt;br /&gt;
* [[Projects:Owan | 光交换广域网]]&lt;br /&gt;
* [[Projects:Stateless-DCN | 无状态数据中心网络]]&lt;br /&gt;
* [[Projects:Stock-Prediction | 多数据源股市预测]]&lt;br /&gt;
* [[Projects:CIDS | CIDS:Adapting legacy intrusion detection system to the cloud with hybrid sampling]]&lt;br /&gt;
* [[Projects:HadoopBenchmark | 虚拟环境下部署大数据系统框架的调度性能研究]]&lt;br /&gt;
* [[Projects:IndoorPositioning | 多人环境下基于WIFI的室内定位]]&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=Projects:IndoorPositioning&amp;diff=415</id>
		<title>Projects:IndoorPositioning</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=Projects:IndoorPositioning&amp;diff=415"/>
				<updated>2016-11-17T03:35:53Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: Created page with &amp;quot;= 项目名称 = 多人场景下基于WIFI的室内定位 = 项目介绍 = == 实验背景 == Wifi localization has been a hot research topic recently attribute to the availab...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= 项目名称 =&lt;br /&gt;
多人场景下基于WIFI的室内定位&lt;br /&gt;
= 项目介绍 =&lt;br /&gt;
== 实验背景 ==&lt;br /&gt;
Wifi localization has been a hot research topic recently attribute to the availability of channel state information(CSI). Based on CSI, we are able to capture both of amplitude and phase information in indoor positioning scene. We are interested in the improvement on original RSS-fingerprint-based localization problems. &lt;br /&gt;
&lt;br /&gt;
Another problem in current WiFi-based approaches is that when more targets exists in the room, the data size required for training data of multiple targets would be exponential large. By using probabilistic methods, we hope to infer multiple targets with the training model of single person. GMM, CRF are used to solve such problem.&lt;br /&gt;
&lt;br /&gt;
== 主要方法 ==&lt;br /&gt;
* 基于CRF图模型进行多人位置推断&lt;br /&gt;
* 以多普勒频移的运动方向感知辅助的多人定位&lt;br /&gt;
&lt;br /&gt;
= 参与人员 =&lt;br /&gt;
申晗&lt;br /&gt;
马文硕&lt;br /&gt;
&lt;br /&gt;
= 相关资料 =&lt;br /&gt;
* 对CSI相关性质的分析 {{#l:week2.pptx}}&lt;br /&gt;
* 基于KNN与Naive Bayes的定位实验{{#l:Localization_alg.pdf}}&lt;br /&gt;
* 室内定位方法Review {{#l:review.pdf}}&lt;br /&gt;
&lt;br /&gt;
= 项目进展 =&lt;br /&gt;
== 2015年3月1日 ==&lt;br /&gt;
文献调研-CSI，定位相关&lt;br /&gt;
== 2015年4月20日 ==&lt;br /&gt;
完成基于KNN和Naive Bayes方法的定位&lt;br /&gt;
== 2015年6月10日 ==&lt;br /&gt;
确认实验方向为基于WIFI的多人定位&lt;br /&gt;
== 2015年7月1日 ==&lt;br /&gt;
尝试使用基于CRF方法的多人位置推断&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= 相关链接 =&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=File:Review.pdf&amp;diff=414</id>
		<title>File:Review.pdf</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=File:Review.pdf&amp;diff=414"/>
				<updated>2016-11-17T03:34:26Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: MsUpload&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;MsUpload&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=File:Localization_alg.pdf&amp;diff=413</id>
		<title>File:Localization alg.pdf</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=File:Localization_alg.pdf&amp;diff=413"/>
				<updated>2016-11-17T03:33:17Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: MsUpload&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;MsUpload&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=File:Week2.pptx&amp;diff=412</id>
		<title>File:Week2.pptx</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=File:Week2.pptx&amp;diff=412"/>
				<updated>2016-11-17T03:31:23Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: MsUpload&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;MsUpload&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=Projects:HadoopBenchmark&amp;diff=411</id>
		<title>Projects:HadoopBenchmark</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=Projects:HadoopBenchmark&amp;diff=411"/>
				<updated>2016-11-17T03:22:35Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= 项目名称 =&lt;br /&gt;
虚拟环境下部署大数据系统框架的调度性能研究&lt;br /&gt;
= 项目介绍 =&lt;br /&gt;
== 项目背景 ==&lt;br /&gt;
&lt;br /&gt;
近年来，随着互联网在全球的大规模普及，大量的用户及系统数据被采集并保存到IT公司数据库。以Facebook公司为例，2012年8月该公司的社交网络数据日产生量达到500T，而这个数字仍在以惊人的速度增长。数据量级的飞跃不仅带来了存储领域的新一轮革命，更让所以的IT公司思考如何使用这些历史数据使之产生新的价值。所幸的是，当前硬件的计算能力已经使我们可以做这些方面的尝试，而上世纪80年代热门的人工智能机器学习终于在今天可以焕发出新的生命力——其中一个普遍的应用场景便是从海量非结构化数据中提取中有用信息。由于数据处理的规模通常达到GB、TB甚至PB级，单个机器早已无法满足这样的计算要求。人们寻求整合了多个计算机的计算能力的方法，其中最优秀的，便是Google在2004年发布的MapReduce。MapReduce是一个处理大数据集的编程模型，通过遵循一定的编程模式，开发者便可以不必考虑集群底层的通信实现轻松写出在大规模集群上并行运行的分布式程序。&lt;br /&gt;
&lt;br /&gt;
Yahoo! 几个工程师根据Google的Mapreduce以及GFS(Google FileSystem)论文写出了它们的开源实现，命名为Hadoop。开源的实现使得全球范围的研究者及工程师可以无门槛地使用Hadoop部署自己的集群并运行MapReduce程序。然而，在物理机上部署一个Hadoop集群有着繁琐的程序，用户往往不得不在不同机器上重复同样的操作或者往往一个简单的修改便需要拷贝文件到所有的机器上。如何“即取即用”地部署Hadoop集群变成了一个非常热切且实际的需求。&lt;br /&gt;
&lt;br /&gt;
与分布式计算框架同时发展的还有虚拟化服务。尽管硬件成本日渐降低，但仍并不是所有公司、研究机构或个人有足够的资金人力创建并维护自己的数据中心的。同时，大公司也可以通过出售剩余计算资源为自己创造新的盈利。虚拟化硬件资源，按需求分配给不同的租户使用，提供所谓IAAS(Infrastructure as a service) PAAS（Platform as a service）和SAAS(Software as a service)。与之对应的虚拟平台包括云计算、容器、以及VMware等公司自己的分布式虚拟技术。Amazon的EC2(Elastic Compute Cloud)和Google的Google Cloud Platform是最出色的商业云平台，有着公司自己的实现及针对自身服务的优化；而目前最火热的开源云平台实现便是OpenStack了。然而，云计算分配给用户的是单独的虚拟机，包括了完全独立的操作系统，对于只需要包装可移植应用的用户是非常大的浪费，于是以Docker为首的容器技术出现并解决了这个问题。&lt;br /&gt;
&lt;br /&gt;
虚拟技术具备的“即取即用”功能非常吻合当前用户对Hadoop的需求。人们也尝试在云上或容器中部署Hadoop集群。本项目基于实验室的集群（百台机器以上），以OpenStack/Docker为云平台/容器的代表，对几种共享式分布式存储的Hadoop与虚拟技术相结合的部署方式进行性能测试，并通过对OpenStack网络机制的研究提出了二层数据交换的部署方式，提升了原本的部署方式性能。&lt;br /&gt;
&lt;br /&gt;
== 项目工作 ==&lt;br /&gt;
&lt;br /&gt;
本项目对Hadoop在虚拟化平台上部署的多种方式进行了较详细及科学的性能测试，目的在于对比实验得到不同类型的MapReduce任务在虚拟平台上运行、同时访问共享式分布式存储带来的性能损益，为其他有大规模Hadoop集群需要的使用者提供参考。虚拟平台上的虚拟机/容器通过二层网络访问宿主机同网段的HDFS。&lt;br /&gt;
&lt;br /&gt;
选取OpenStack —— 当下使用者最多最受欢迎的开源云平台作为云计算的代表实现，Docker——  一种轻量级打包运行程序并提供网络、计算资源隔离的工具作为容器技术的代表实现， 进行以下几种部署方式的性能测试：&lt;br /&gt;
&lt;br /&gt;
*基准线： HDFS和Hadoop Yarn都部署在物理机上&lt;br /&gt;
** HDFS部署在物理机， Hadoop Yarn在OpenStack虚拟机中运行，通过Open vSwitch bridge访问HDFS&lt;br /&gt;
** HDFS 部署在物理机，Hadoop Yarn在Docker容器中运行，Open vSwitch bridge访问HDFS&lt;br /&gt;
&lt;br /&gt;
完成以上实验主要工作将经历以下三个阶段：&lt;br /&gt;
&lt;br /&gt;
第一阶段实验环境和基本平台搭建。物理机环境的下Hadoop的部署，OpenStack虚拟机镜像准备，Docker镜像准备等。&lt;br /&gt;
&lt;br /&gt;
第二阶段着重于部署平台过程与网络优化问题的解决。研究OpenStack网络设置，对环境甚至源码进行必要的修改以实现二层网络功能；对Docker的网络部署进行研究，通过Openswitch搭建可用的Docker分布式集群；批量创建OpenStack虚拟机与Docker容器并在其上分别搭建Hadoop集群；相关技术问题的解决。此阶段会遇到各种各样的问题，需要学会在集群中批量运行程序、查看OpenStack日志和Hadoop各组件日志来调试运行错误并了解系统配置对程序的影响。&lt;br /&gt;
&lt;br /&gt;
第三个阶段使用基准测试对Hadoop进行性能测试，使用系统监测工具收集实验数据并对采集到的数据处理分析、画出性能监测图、运行时间对比图并进行相关分析。本文选取Intel的HiBench基准测试工具包进行Hadoop性能测试。&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= 参与人员 =&lt;br /&gt;
申晗&lt;br /&gt;
导师：徐葳&lt;br /&gt;
&lt;br /&gt;
= 相关资料 =&lt;br /&gt;
&lt;br /&gt;
= 项目进展 =&lt;br /&gt;
== 2015年3月1日 ==&lt;br /&gt;
完成OpenStack基本环境搭建&lt;br /&gt;
== 2015年4月1日 ==&lt;br /&gt;
完成Docker基本环境搭建&lt;br /&gt;
== 2015年5月20日 ==&lt;br /&gt;
完成Benchmark测试&lt;br /&gt;
== 2015年6月3日 ==&lt;br /&gt;
毕业论文提交&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= 相关链接 =&lt;br /&gt;
* [https://github.com/iiisthu/HadoopBenchmark] 相关脚本&lt;br /&gt;
&lt;br /&gt;
* [https://github.com/iiisthu/HadoopTemplate 一个虚拟机中一键部署Hadoop的模板]&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=Projects&amp;diff=410</id>
		<title>Projects</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=Projects&amp;diff=410"/>
				<updated>2016-11-17T03:22:04Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;* [[Projects:project_test | 项目示例]]&lt;br /&gt;
* [[Projects:Owan | 光交换广域网]]&lt;br /&gt;
* [[Projects:Stateless-DCN | 无状态数据中心网络]]&lt;br /&gt;
* [[Projects:Stock-Prediction | 多数据源股市预测]]&lt;br /&gt;
* [[Projects:CIDS | CIDS:Adapting legacy intrusion detection system to the cloud with hybrid sampling]]&lt;br /&gt;
* [[Projects:HadoopBenchmark | 虚拟环境下部署大数据系统框架的调度性能研究]]&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=Projects:HadoopBenchmark&amp;diff=409</id>
		<title>Projects:HadoopBenchmark</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=Projects:HadoopBenchmark&amp;diff=409"/>
				<updated>2016-11-17T03:19:52Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: Created page with &amp;quot;= 项目名称 = 虚拟环境下部署大数据系统框架的调度性能研究 = 项目介绍 = == 项目背景 ==  近年来，随着互联网在全球的大规模普及，...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= 项目名称 =&lt;br /&gt;
虚拟环境下部署大数据系统框架的调度性能研究&lt;br /&gt;
= 项目介绍 =&lt;br /&gt;
== 项目背景 ==&lt;br /&gt;
&lt;br /&gt;
近年来，随着互联网在全球的大规模普及，大量的用户及系统数据被采集并保存到IT公司数据库。以Facebook公司为例，2012年8月该公司的社交网络数据日产生量达到500T，而这个数字仍在以惊人的速度增长。数据量级的飞跃不仅带来了存储领域的新一轮革命，更让所以的IT公司思考如何使用这些历史数据使之产生新的价值。所幸的是，当前硬件的计算能力已经使我们可以做这些方面的尝试，而上世纪80年代热门的人工智能机器学习终于在今天可以焕发出新的生命力——其中一个普遍的应用场景便是从海量非结构化数据中提取中有用信息。由于数据处理的规模通常达到GB、TB甚至PB级，单个机器早已无法满足这样的计算要求。人们寻求整合了多个计算机的计算能力的方法，其中最优秀的，便是Google在2004年发布的MapReduce。MapReduce是一个处理大数据集的编程模型，通过遵循一定的编程模式，开发者便可以不必考虑集群底层的通信实现轻松写出在大规模集群上并行运行的分布式程序。&lt;br /&gt;
&lt;br /&gt;
Yahoo! 几个工程师根据Google的Mapreduce以及GFS(Google FileSystem)论文写出了它们的开源实现，命名为Hadoop。开源的实现使得全球范围的研究者及工程师可以无门槛地使用Hadoop部署自己的集群并运行MapReduce程序。然而，在物理机上部署一个Hadoop集群有着繁琐的程序，用户往往不得不在不同机器上重复同样的操作或者往往一个简单的修改便需要拷贝文件到所有的机器上。如何“即取即用”地部署Hadoop集群变成了一个非常热切且实际的需求。&lt;br /&gt;
&lt;br /&gt;
与分布式计算框架同时发展的还有虚拟化服务。尽管硬件成本日渐降低，但仍并不是所有公司、研究机构或个人有足够的资金人力创建并维护自己的数据中心的。同时，大公司也可以通过出售剩余计算资源为自己创造新的盈利。虚拟化硬件资源，按需求分配给不同的租户使用，提供所谓IAAS(Infrastructure as a service) PAAS（Platform as a service）和SAAS(Software as a service)。与之对应的虚拟平台包括云计算、容器、以及VMware等公司自己的分布式虚拟技术。Amazon的EC2(Elastic Compute Cloud)和Google的Google Cloud Platform是最出色的商业云平台，有着公司自己的实现及针对自身服务的优化；而目前最火热的开源云平台实现便是OpenStack了。然而，云计算分配给用户的是单独的虚拟机，包括了完全独立的操作系统，对于只需要包装可移植应用的用户是非常大的浪费，于是以Docker为首的容器技术出现并解决了这个问题。&lt;br /&gt;
&lt;br /&gt;
虚拟技术具备的“即取即用”功能非常吻合当前用户对Hadoop的需求。人们也尝试在云上或容器中部署Hadoop集群。本项目基于实验室的集群（百台机器以上），以OpenStack/Docker为云平台/容器的代表，对几种共享式分布式存储的Hadoop与虚拟技术相结合的部署方式进行性能测试，并通过对OpenStack网络机制的研究提出了二层数据交换的部署方式，提升了原本的部署方式性能。&lt;br /&gt;
&lt;br /&gt;
== 项目工作 ==&lt;br /&gt;
&lt;br /&gt;
本项目对Hadoop在虚拟化平台上部署的多种方式进行了较详细及科学的性能测试，目的在于对比实验得到不同类型的MapReduce任务在虚拟平台上运行、同时访问共享式分布式存储带来的性能损益，为其他有大规模Hadoop集群需要的使用者提供参考。虚拟平台上的虚拟机/容器通过二层网络访问宿主机同网段的HDFS。&lt;br /&gt;
&lt;br /&gt;
选取OpenStack —— 当下使用者最多最受欢迎的开源云平台作为云计算的代表实现，Docker——  一种轻量级打包运行程序并提供网络、计算资源隔离的工具作为容器技术的代表实现， 进行以下几种部署方式的性能测试：&lt;br /&gt;
&lt;br /&gt;
*基准线： HDFS和Hadoop Yarn都部署在物理机上&lt;br /&gt;
** HDFS部署在物理机， Hadoop Yarn在OpenStack虚拟机中运行，通过Open vSwitch bridge访问HDFS&lt;br /&gt;
** HDFS 部署在物理机，Hadoop Yarn在Docker容器中运行，Open vSwitch bridge访问HDFS&lt;br /&gt;
&lt;br /&gt;
完成以上实验主要工作将经历以下三个阶段：&lt;br /&gt;
&lt;br /&gt;
第一阶段实验环境和基本平台搭建。物理机环境的下Hadoop的部署，OpenStack虚拟机镜像准备，Docker镜像准备等。&lt;br /&gt;
&lt;br /&gt;
第二阶段着重于部署平台过程与网络优化问题的解决。研究OpenStack网络设置，对环境甚至源码进行必要的修改以实现二层网络功能；对Docker的网络部署进行研究，通过Openswitch搭建可用的Docker分布式集群；批量创建OpenStack虚拟机与Docker容器并在其上分别搭建Hadoop集群；相关技术问题的解决。此阶段会遇到各种各样的问题，需要学会在集群中批量运行程序、查看OpenStack日志和Hadoop各组件日志来调试运行错误并了解系统配置对程序的影响。&lt;br /&gt;
&lt;br /&gt;
第三个阶段使用基准测试对Hadoop进行性能测试，使用系统监测工具收集实验数据并对采集到的数据处理分析、画出性能监测图、运行时间对比图并进行相关分析。本文选取Intel的HiBench基准测试工具包进行Hadoop性能测试。&lt;br /&gt;
== 项目结果 ==&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= 参与人员 =&lt;br /&gt;
申晗&lt;br /&gt;
导师：徐葳&lt;br /&gt;
&lt;br /&gt;
= 相关资料 =&lt;br /&gt;
&lt;br /&gt;
= 项目进展 =&lt;br /&gt;
== 2015年3月1日 ==&lt;br /&gt;
完成OpenStack基本环境搭建&lt;br /&gt;
== 2015年4月1日 ==&lt;br /&gt;
完成Docker基本环境搭建&lt;br /&gt;
== 2015年5月20日 ==&lt;br /&gt;
完成Benchmark测试&lt;br /&gt;
== 2015年6月3日 ==&lt;br /&gt;
毕业论文提交&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
= 相关链接 =&lt;br /&gt;
* [https://github.com/iiisthu/HadoopBenchmark] 相关脚本&lt;br /&gt;
&lt;br /&gt;
* [https://github.com/iiisthu/HadoopTemplate 一个虚拟机中一键部署Hadoop的模板]&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=User:Shenh10&amp;diff=408</id>
		<title>User:Shenh10</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=User:Shenh10&amp;diff=408"/>
				<updated>2016-11-17T02:46:32Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: Created page with &amp;quot;When choosing cloud platform such as OpenStack to deploy a computing framework, the main challenge exists in efficiency. To store processing data inside Virtual Machines is ne...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;When choosing cloud platform such as OpenStack to deploy a computing framework, the main challenge exists in efficiency. To store processing data inside Virtual Machines is neither reliable nor  collaborative.&lt;br /&gt;
&lt;br /&gt;
However, deploying a shared filesystem on physical machine leads to bottleneck of network bandwidth at the Neutron node. We promoted a solution achieving better networking performance in such a deploy case.  By hacking into OVS and OVS Agent, I have achieved Hadoop's layer2 access to physical HDFS which improved the locality and avoided layer3 router congestion. Furthermore, Docker can also utilize this solution to get switching performance comparing to Linux Iptables forwarding. Based on such optimized platforms of 100+ nodes cluster, I have done a benchmark on how Hadoop behaves when deployed on virtualization platforms(&lt;br /&gt;
Baremental, OpenStack, Docker)&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
A set of bash scripts goes here https://github.com/iiisthu/HadoopBenchmark&lt;br /&gt;
&lt;br /&gt;
And a template for deploy Hadoop in Openstack Virtual Machines goes here https://github.com/iiisthu/HadoopTemplate&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php?title=SharedBooks&amp;diff=80</id>
		<title>SharedBooks</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php?title=SharedBooks&amp;diff=80"/>
				<updated>2014-12-01T07:47:17Z</updated>
		
		<summary type="html">&lt;p&gt;Shenh10: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;请大家把自己愿意和组里的人共享的书列在这里。可以包括组里购买的书籍，以及自己购买但是愿意分享给大家的书籍。&lt;br /&gt;
&lt;br /&gt;
格式建议为“书名（版本）+作者+译者”。&lt;br /&gt;
&lt;br /&gt;
如果长期借用了某些书的话，请更改本页面及时更新信息。：）&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
*[[User:Caorc|Caorc]] ([[User talk:Caorc|talk]]) 16:34, 27 November 2014 (CST)&lt;br /&gt;
#编程之美——微软技术面试心得        《编程之美 》小组&lt;br /&gt;
#深入理解计算机系统（英文版第二版）        Bryant O'Hallaron&lt;br /&gt;
#编程珠玑（续）        Jon Bentley        钱丽艳 刘田&lt;br /&gt;
&lt;br /&gt;
*[[User:Zhangyang|Zhangyang]] ([[User talk:Zhangyang|talk]]) 16:57, 27 November 2014 (CST)&lt;br /&gt;
#分布式系统-概念与设计（英文版）        George Coulouris&lt;br /&gt;
#人工智能-一种现代方法（英文版）        Stuart J. Russell&lt;br /&gt;
#机器学习-实用案例解析        Conway &amp;amp; White&lt;br /&gt;
#利用Python进行数据分析        McKinney&lt;br /&gt;
#凸优化        Stephen Boyd&lt;br /&gt;
#R语言核心技术手册        Joseph Adler&lt;br /&gt;
&lt;br /&gt;
*[[User:Wangguosai|王国赛]] ([[User talk:Wangguosai|talk]]) 23:10, 29 November 2014 (CST)&lt;br /&gt;
#Learning Python(第五版上册)      Mark Lutz&lt;br /&gt;
#Learning Python(第五版下册)      Mark Lutz&lt;br /&gt;
&lt;br /&gt;
*[[User:Shenh10|申晗]]:[[User:Shenh10|Shenh10]] ([[User talk:Shenh10|talk]]) 15:47, 1 December 2014 (CST)&lt;br /&gt;
#Unix环境高级编程(第三版)        W.Richard Stevens       戚正伟等译&lt;br /&gt;
#深入理解Java虚拟机(第二版)        周志明       &lt;br /&gt;
#Linux内核设计与实现（英文第三版） Robert Love&lt;br /&gt;
#模式分类 （第2版） Richard O.Duda 李宏东译&lt;br /&gt;
#Java编程思想  Bruce Eckel著 陈昊鹏译&lt;br /&gt;
#编译原理（英文第二版）Alfred V.Aho &lt;br /&gt;
&lt;br /&gt;
*TEMPLATE:请用4个波浪线替换此处&lt;br /&gt;
#BOOK(EDITION)        AUTHOR        TRANSLATOR&lt;br /&gt;
#BOOK(EDITION)        AUTHOR        TRANSLATOR&lt;/div&gt;</summary>
		<author><name>Shenh10</name></author>	</entry>

	</feed>