3)以Hadoop、MapReduce等并行数据处理框架为基础,进一步实现算法运算和数据处理的并行化,对大数据环境下的此类问题进行研究;)常见学习算法的训练通常都已较为成熟,但某些方法的参数选择却较为困难,如各种基于核函数的算法,从不同角度对此进行了研究;
4)已有成果中,算法的评估多采用算例结果
有效性评价方式,对算法性能和结果可信度的反应不够全面,应加强相关的理论分析,如计算复杂度:电力大数据技术与电力系统仿真计算结合问题研究出错界限等。
实际应用在实际应用方面,针对不同电网的同一类问题,在分析方法相同的条件下,其分析模型的训练结果很可能不同。因此,在开展研究时应同时建立完整的解决方案,给出可以复用的、算法化的建模、训练和应用方法,并软件实现。
同时,还需考虑以下问题:
5)样本抽取。在线计算历史数据的积累可能长达数年,应根据预测需要选取样本,建立与时刻、日、月、年,以及长期预测相对应的样本抽取机制;)计算效率。在提高模型和算法的计算效率方面,可作的工作还有:①修改仿真程序输出,简化数据处理;②减少模型种类,优化特征量的生成过程;③将数据处理分散到在线仿真计算各步骤中进行,如在潮流计算完毕后,立即统计与潮流结果有关的特征量,而不是等到全部计算完成;④使用高效的数据处理语言,如R语言、Matelab等;)结果展示。应进一步发展系统演变的描述方式,如通过数据分析结果、特征量或主导特征值的图形表示来描述系统变化,以避免直接采用原始仿真计算结果导致的数据粒度过细、研究分析困难等问题;
6)系统集成。由于电网仿真目前已有较为成熟的计算软件和系统,因此数据分析功能在初期可以函数、模块或动态库的方式与之相结合,在需要时由计算软件调用。随着技术的逐步成熟,大数据分析在仿真计算程序中的作用将逐步提高,其独立性也会随之增强,最终有可能发展成为一种新的、独立形态的电网分析系统。
知识提取与利用人工智能技术的进步可以为电网仿真分析知识的建模和应用提供良好的基础,但知识模型的最终建立依然需要结合电网专业知识开展研究[8,86-88]。此外,还需进行以下方面的工作:
7)知识发现。除了分析结论外,在特征值选取、压缩,以及分析算法的处理过程中都可能提取到新的知识。这些环节中知识的表现形式不尽相同,但最终都需经由因果关系解读,对因果关系与关联关系进行了比较;
8)再学习。从大规模数据中提取的规律,其原始表达本身可能很复杂,如一条关联规则可由数十、乃至数百个频繁项组成,不经过自动化的缩减、凝练处理,根本无法理解。基于先验知识,利用语义转换可有助于将初始结果泛化,例如借助分区信息,将各个母线的具体电压水平概括为分区电压的高、低状态,从而更易解读;
9)知识应用。在电网仿真数据分析的各主要环节均可引入先验知识以提高效率、提升效果,但如何在算法级别实现形式化建模的知识与已有算法的融合还需深入研究。引入大数据技术可能带来的问题大数据技术与电力系统仿真相结合也会带来一些问题,除了一般性的资源占用过多、重复发现已有知识等不利影响外,
10)边际效应。大型电网分析系统一般都是分阶段建立的,在经过最初的高产出比阶段之后,各种资源的新增投入与数据分析效果提升的比值将会越来越大,直至失去技术经济意义;
11)数据共享。实际电力系统仿真数据有保密要求,一般用户很难获得。而大数据技术的引入需要有众多的参与者,在无法获得足够样本的情况下,大量研究工作难以展开;
12)“正确的”错误。在没有模型、算法错误的前提下,数据分析发现的关联也有可能只是表面现象,如关联是偶然的,或者中间存在诸多环节、不具有实际价值等。冒然使用这样的结果,可能会对电网运行安全造成不利影响;
13)决策困境。数据分析和仿真计算的结论可能会不一致,如果按“最严重”标准选取结果,可能会导致付出不必要的代价。
14)开展“预言性数据分析问题”研究,确定解决目标问题所需的数据量,对资源投入和数据分析效果作出合理预估,从而指导系统的构建。目前尚缺乏这方面的深入探讨和实际应用。
15)将共享数据改为传递算法,即建立开放性的算法研究平台[90],研究者将其数据分析程序传递到平台上进行验证;
16)对于问题3和4,最根本的解决途径是结合已知的电力系统物理特性,对数据分析结论进行合理解释,包括其背后的因果联系、适用条件、成立概率等。在此基础上可以剔除无用的分析结果并逐步建立对大数据技术的信心。
展望随着技术的成熟,未来电力大数据平台将会与ERP等系统类似,成为电力系统规划、设计、运行、管理的一个“基础设施”。电网各领域看待问题的视角将会由当前的信息和结果,逆着数据变化的趋势向问题的源头溯源移动。同时,也会依从数据变化的规律,探索其新的趋向,发现潜藏于其中的未来景象。
电力系统仿真技术领域的数据具有较强的物理和数学联系。利用大数据技术实现对其的有效观测,以及以既有知识为基础的深度分析,将会使对电网的研究,从以“初始-结果”模式为主提升到新的高度,更多地关注系统的演变、数据的变化与融合等方面,开创出新的视角。
电力系统仿真作为一个以保障电网安全为主要目的领域,其所有研究都需要有坚实的理论基础。因此,相关的数据研究必将由现象的发现走向其背后原因的分析,并尽可能上升到理论高度,这为大数据技术在其中的应用提出了新挑战。
综上所述,大数据技术与电力系统仿真的结合将能够为系统分析提供新的手段、视角,甚至于方法。本文基于对仿真分析和电力大数据的认识,探讨了该方面研究可能的思路和要点,后续将在此基础上进一步开展具体工作。本文的研究也可为电力大数据涉及的其他相关领域提供积极的参考。
参考文献
中国电机工程学会信息化专委会.中国电力大数据发展白皮书(2013)[R].北京:中国电机工程学会,2013..
宋亚奇,周国亮,朱永利.智能电网大数据处理技术现状与挑战[J].电网技术,2013,37(4):927-935
屈志坚,郭亮,陈秋琳,等.Hadoop云构架的智能调度无损集群压缩技术[J].电力系统自动化,2013,:93-98.
杨劲锋,刘涛,陈启冠,等.基于海量计量数据的电力客户在线分群研究[J].华东电力,2013,41(8):
周国亮,宋亚奇,王桂兰,等.状态监测大数据存储及聚类划分研究[J].电工技术学报,2013,28(S2):
丁杰,朱力鹏,胡斌,等.面向多级调度管理的融合型搜索引擎[J].电力系统自动化,2014,38(3):150-154.,
曲朝阳,陈帅,杨帆,等.基于云计算技术的电力大数据预处理属性约简方法[J].电力系统自动化,2014,:67-71.
黄彦浩,周孝信.基于本体理论的智能电网广义数据管理模型研究[J].电力系统自动化,2014,38(9):114-118.,
中国计算机学会大数据专家委员会.中国大数据技术与产业发展白皮书(2013)[R].北京:中国计算机学会,.
孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-169.
李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考.中国科学院院刊,2012,27(6):647-657.
(www.fabiaoba.com),是一个专门从事期刊推广期刊发表、投稿辅导、发表期刊的网站。
本站提供如何投稿辅导、发表期刊,寻求论文刊登合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级论文刊登/国家级论文刊登/
CSSCI核心/医学投稿辅导/职称投稿辅导。
投稿邮箱:fabiaoba365@126.com
在线咨询:
275774677、
1003180928
在线咨询:
610071587、
1003160816
联系电话:18796993035
期刊简介 : 《电气制造》(月刊)创刊于2005年,是由国家新闻出版总署批准注册,机械...
期刊介绍: 中国港口杂志是由中华人民共和国新闻出版总署、正式批准公开发行的优秀期...
期刊简介: 《山东行政学院学报》Journal of Shandong Academy of Governance(月刊)...
主管单位:中国科学院 主办单位:中国科学院自然科学期刊编辑研究会 出版地:北京市 ...
期刊简介: 《太原理工大学学报》JournalofTaiyuanUniversityofTechnology(双月刊)...
期刊介绍: 杂志是重庆工商大学主办、国家教育部人文社科重点研究基地长江上游经济研...
近来发现有些作者论文投稿存在大量剽窃、抄袭行为,“发表吧”对此类存在大量剽窃、抄袭的论文已经停止编辑、推荐。同时我们也提醒您,当您向“发表吧”投稿时请您一定要保证论文的原创性、唯一性,这既是对您自己负责,更是对他人的尊敬。
此类投稿的论文如果发表之后,对您今后的人生和事业将造成很大的麻烦,后果不堪设想,请您一定要慎重,三思而后行。
如因版权问题引起争议或任何其他原因,“发表吧”不承担任何法律责任,侵权法律责任概由剽窃、抄袭者本人承担。