Data Science 기반 기후변화 대응 지원 플랫폼 구축을 위한 전략 마련 연구(Ⅱ)

표종철; 조윤랑; 한국진; 김도연; 김선태; 한현경
Issue Date
Series/Report No.
기후환경정책연구 : 2021-02
259 p.
연구데이터관리계획(DMP), 기후변화 대응, 데이터플랫폼, 연구데이터, 기후환경데이터, Data Management Plan (DMP), Climate Change Response, Data Platform, Research Data, Climate Environment Data
Ⅰ. Introduction ? Necessity and purpose of the study ㅇ The intensification of climate change phenomena such as abnormal weather conditions and natural disasters affects not only the natural environment but also human activities in various ways. ㅇ Recently, Korea has pledged to reach net-zero emissions by 2050 in cooperation with the international community and has been actively responding to climate change. ㅇ Climate change can be divided into mitigation efforts to reduce greenhouse gas and adaptation efforts to minimize damage and risk. However, since climate change occurs due to multiple causes, complementary policies on both efforts are needed. ㅇ In 2018, the Ministry of Science and ICT established the “Strategy for Sharing and Utilization of Research Data” to manage and share research data accumulated during the promotion of national R&D projects, and the era of data-intensive science is coming in earnest. - The development of equipment such as hardware and high-performance networks has produced a great deal of research data, and the management of various research data is an essential element for effective research performance. ㅇThis study aims to promote the climate change response focusing on data, which means to convert climate change research into one that is based on data science. - “Data Science” is a generic term for the process of understanding actual phenomena and deriving useful knowledge from various types of data. -As more data such as data from information and communication technology (ICT), satellite data, and meteorological reinterpretation data are generated, it is important to secure relevant data to link and utilize them. ㅇ Data for climate change response are scattered across various organizations and there are many constraints in terms of data utilization due to the absence of a standard system for classifying environmental data. Thus, it is urgent to come up with measures to utilize data efficiently and conveniently. ? Scope of the study ㅇAnalyze the current status of climate environment data, establish and operate an implementation system of the data management plan (DMP), and prepare a strategy for establishing a climate environment data platform as well as a plan for providing differentiated data services - Prepare a data inventory in the mitigation & reduction sector to respond to climate change based on the status of satellite-centered climate environment application data and data survey in the climate change mitigation sector - Define the scope of research data and introduce a data management plan (DMP) for establishing a practical implementation system for climate environment data management, and establish the KEI-type data management promotion system centered on research data repository (IDR) -Seek ways to provide climate environment data services that can be used for environmental policy research based on the established climate environment data inventory and management system ?Climate environment data is limited to public data related to mitigation and adaptation to respond to climate change in this project. ?This study aims to prevent the use of various accumulated data in a single research project only and maximize the sharing and utilization of data. -Review the laws and systems related to data sharing and utilization, as well as surveys for establishing a climate environment data platform, and suggest realistic plans for policy research centered on climate change data ? Content and methodology ㅇIn the second year of the study, building and supplementing the greenhouse gas reduction data in major environmental organizations and promoting the advancement of the existing inventory are planned. -This study examines the possibility of expanding the scope of climate change response data based on the satellite data outputs and the status of meteorological and climate data collected by the Korea Meteorological Administration among climate environment data. ㅇThis study seeks to derive the essential elements for defining and managing research data for the preparation and establishment of the KEI research data management system. ㅇThis study aims to develop a roadmap for constructing the KEI climate environment data platform based on research data management systems investigated and expert opinions. ㅇTo expand the above platform and make it the KEI-type data platform in the future, we plan to upload the collected meta-information of climate change response data to the research data repository system on a trial basis, and improve policy utilization through the data mind map trial services. Ⅱ. Advancement of the Climate Environment Data Inventory ? Current status of domestic climate environment application data ㅇClimate change greatly affects not only precipitation, cloud amount, and temperature, but also vegetation distribution and land distribution, and to respond to these, primary data needs to be secured. ㅇOverseas, satellite data are being used for observation in various areas, such as air-polluting gases, climate change-causing gases, aerosols, and vegetation index changes, led by the National Aeronautics and Space Administration (NASA) and the European Space Agency (ESA). ㅇIn Korea, a geostationary complex satellite was launched following the Communications Oceanic and Meteorological Satellite (COMS), and the data produced through the satellite observation are used as basic data in developing climate change response policies. ㅇKorea’s representative satellites include the Geostationary Ocean Color imgaer (GOCI), Chollian Satellite, Geostationary Korea Multi-Purpose Satellite-2B, and GEO-KOMSAT-2A. - The GOCI is used to monitor red tide, sea ice, sea fog, marine dumping, marine sand mining activities, fine dust, and so on. ?As the major outputs, 13 types of data are produced, including the data on dissolved organic matter, chlorophyll, total suspended matter, red tide index, and terrestrial vegetation index. -Geostationary Satellite 2B observes the marine environment and ecosystem, monitors air pollutants outside the Korean Peninsula, and provides data for responding to climate change and monitoring fine dust. ?A total of 26 types of data are provided, including atmospheric correction, unique optical characteristics, atmospheric data, sea color data, ocean data, and land data. -Compared to the GOCI, GEO-KOMSAT-2A Satellite is capable of various observations, and it is possible to monitor and prepare for meteorological disasters. ?A total of 52 types of meteorological data are produced, 23 types of which being basic ones including cloud detection, ozone amount, and rainfall intensity, and 29 types being additional ones including forest fire detection, vegetation index, vegetation rate, and surface reflectance. ? Current status of climate change response data ㅇResponding to climate change should be considered in terms of both mitigation policies (reducing or absorbing greenhouse gases) and adaptation policies (reducing damage from climate change). ㅇThis study aims to link climate change mitigation policies and adaptation policies by examining the current status of climate change mitigation data such as energy, power generation, and greenhouse gas emissions. ㅇData in the climate change mitigation (greenhouse gas reduction) sector can be largely divided into energy statistics, the national greenhouse gas inventory, and other related and usable data. -The Korea Energy Statistical Information System links and integrates statistics related to energy balance and national energy supply and demand, as well as statistical data from related organizations in accordance with the regulations on preparing energy statistics. -The national greenhouse gas inventory provides data to identify domestic greenhouse gas emission sources, sinks, and the amount of emissions and absorption to respond to climate change. -Other data include traffic/transport and electricity data to support the emission calculation and analysis in the public and private sectors as well as academic world and to link greenhouse gas inventories. ㅇThe climate change adaptation sector builds the climate environment data inventory based on the data established in the system operated by the National Climate Change Adaptation Center (KACCC). -Vulnerability assessment data for adaptation to climate change are provided by the integrated assessment model for climate change impact and vulnerability by sector (MOTIVE) and climate change vulnerability assessment tool (VESTAP), which are representative climate change adaptation systems. ㅇVarious weather observation data and disaster prevention meteorological information observed and provided by the Korea Meteorological Administration are used as basic data in various fields, such as in predicting the future of climate change and establishing response policies. -Climate change scenarios can be used for analysis in impact assessment due to future climate change and research on minimizing the damage, and it is used as essential information for establishing and supporting climate change response and adaptation measures. Ⅲ. Establishment of a Climate Environment Data Management System ? Overview of KEI research data management ㅇEfforts to share and utilize domestic research data are actively pursued following the implementation of the regulations on Data Management Plan (DMP) in 2019. -There are successful cases of data preservation and reuse from national R&D projects in major advanced countries, and open data activities are spreading around the world. -Research data and data management plans are defined in the Regulations on the Management of National Research and Development Projects. The basis for managing research data at the national level is established by stipulating the requirement to submit DMP when conducting national R&D projects. ㅇ Core elements for managing and providing research data can be divided into supporting DMP preparation, data file organization, data storage, data sharing and access, data citation, and data management education. ? Research data collection and management ㅇResearch data is factual data calculated through various experiments, observations, investigations, and analysis conducted in the course of conducting R&D tasks, and is essential for the verification of research results. - Research data refers to all data generated in the research process, so it must be distinguished from research records such as e-mails or technical reports. - In order to support continuous research activities and to preserve and share research results, it is necessary to manage the data generated during the research process in the research institute to which the researcher belongs and the community in which the researcher is active. ㅇ DMP refers to an official document describing how research data produced and collected through a research project is managed and shared during or after the research project. -DMP allows faithful data description before data collection, which eliminates the need for researchers to make efforts to memorize details about data and allows data reuse. ㅇ Research data management is an act that occurs in all processes, from the research planning stage to data production, collection, management, preservation and disposal, publication, and reuse in accordance with the research life cycle. ㅇ For the development of the KEI climate environment data platform, it is important to identify the research data life cycle and confirm the details. ? Establishment of a research data management system ㅇ Data repository is developed as an open source and can utilize open software, and DSpace and NaRDA are representative examples. - DSpace makes it easy to submit files and accommodates a variety of files by providing a web-based interface, and it can be expanded to a large-scale, multi-disciplinary repository beyond one institution. - NaRDA is a research data repository developed and disseminated by the Korea Institute of Science and Technology Information (KISTI), designed and implemented in consideration of the cycle of researchers’ data management activities. ? On NaRDA, users can fill out DMP submission forms, post and share them. ? In the stage of conducting research, data for research can be freely uploaded and downloaded, and data description can be provided. ? In the last stage, research data can be registered for sharing research results, and for this purpose, metadata extraction and DOI grant functions are provided. ㅇResearch data consists of metadata and source data, and metadata is an index element used in data retrieval systems to describe data. ㅇMetadata describes the properties of data, provides context and data quality information, and it refers to the documentation of the characteristics of other objects or data. ? Preservation and sharing of research data ㅇWhen digital research data is preserved, various benefits can be generated and preservation of data requires human and material resources. -For data preservation, a method to collect the relevant information should be systematically provided, and there should be given a permanent identifier (DOI, ARK, UUID, etc) for preservation and publication. ?The most commonly used permanent identifier is DOI, and organizations that publish data using the DOI prefix issued by KISTI can publish data by adding a suffix. ㅇIn relation to data publication, it is necessary to reflect the will of the researcher, and it is also necessary to set the ranges for internal and external sharing and design frames and functions that can express the level of the researcher’s demand. ㅇEffective use, sharing, and reuse of research data can be expected by improving the data literacy ability of researchers, and a compensation system for data disclosure should be prepared to promote research data sharing and reuse. ? Research data construction service cases and implications ㅇThe Korea Institute of Geoscience and Mineral Resources (KIGAM) has been operating GDR, a geological data repository, recognizing that duplicate research is being conducted due to the absence of a management system for research data. -GDR is the first repository that issues DOIs for data access control functions and data linked to external data, and implements a system that includes the DMP form in the business plan. ㅇ The Korea Institute of Oriental Medicine (KIOM) has been operating the oriental medicine research data repository (KMDR). - KMDR is an information system for systematic management and sharing of research data in the field of oriental medicine, established for the purpose of supporting efficient research performance through data management support and enhancement of utilization. -By linking the encryption module application for the protection of research data from external threats and DMP creation and management functions, it is possible to manage the entire period of research data. ㅇThe National Institute of Forest Science newly established a provision on the obligatory management of research data through a partial revision (February 11, 2019) of the “Regulations on Research Project Management of the National Institute of Forest Science (Regulation No. 307).” -It established a reward plan to promote active research data management and raise awareness on the participation to support data-based convergence forest science research. ㅇ In order to create a research data management and governance system, continuous education is required so that the perception of researchers and management can change in a positive way, and continuous cooperation with leading institutions is important. ? Establishment of the KEI research data utilization and management system ㅇThere are few data production cases in environmental policy research, and applying the DMP and research data repository system operated in the science and technology field has limitations due to the integrated and complex format of social and natural science research. ㅇBased on the data classification status of major institutions, KEI research data is classified according to types and formats of data and data production methods. -Types and formats of data (indicator/index, policy database, measurement/observation, simulation, literature, expert opinion, presentation materials/policy document, etc) - Data production methods (internal-produced, internal-processed, external-produced, external-processed, etc) ㅇ KEI needs to systematically manage research data in order to prevent its loss, establish sustainable environmental policies, prepare a multidisciplinary convergence research system through data linkage, and support evidence-based policy decision-making. - DMP was introduced (implemented in June 2021) when research projects for 2022 were proposed to improve the efficiency of research performance management through data performance management, facilitate the dissemination of research results, and create a data-based research cooperation ecosystem. - For the efficient operation of the first DMP applied in the institute, research data is defined as data used during the environmental (policy) research process or major research outcomes. ㅇ This study aims to prepare a DMP-centered data management system by establishing a research repository, linking intranet accounts to the repository, registering metadata, and preparing plans to connect DMP and IDR. Ⅳ. KEI Climate Environment Data Platform Construction Strategy ? Overview of KEI climate environment data platform construction ㅇEfforts are underway to share and utilize various research data through the establishment of a data platform, promoting the use of research data at the national level, and creating an advanced research environment for convergence research, open science, and so on. ㅇData is being produced exponentially in various fields, but there are still issues related to the ownership and disclosure of information. -There is a lack of appropriate legislation in terms of integrating and using data and using them jointly across sectors. -The foundation is being laid for data industry revitalization through the revision and enforcement of the “Three Data Privacy Acts” and the “Act on the Promotion of Data-based Administration” but there is a high possibility of problems such as overlapping regulations occurring. ㅇThis study summarizes the current status of laws and systems related to information access and services and research data management to manage climate environment research data and prepare a platform construction strategy. - The main laws and systems related to data use and utilization include the Framework Act on Environmental Policy, Electronic Government Act, Framework Act on National Informatization, Act on Promotion of the Provision and Use of Public Data, Framework Act on Intelligent Informatization, Act on the Promotion of Data-based Administration, Special Act on Promotion of Information and Communications Technology and Vitalization of Convergence Thereof, Regulations on the Management of National Research and Development Projects, and the Act on Promotion of Information and Communications Network Utilization and Information Protection, etc. ㅇ First, we drew out the requirements for improvement from the current laws and systems related to the use and utilization of data in terms of research data management. -It is necessary to add a clause recommending (research) data management to the Regulations on the Management of National Research and Development Projects and to recommend in the Act on the Promotion of Data-based Administration that institutions establish metasystems and IDR systems be constructed. ? Establishment of the KEI Climate Environment Data Platform Construction Strategy ㅇCurrently, big data platform projects are being actively carried out, but there are still difficulties in acquiring data that can be used for climate environment policy research on multiple platforms. ㅇA survey was conducted among experts in various media who conducted environmental policy research in order to establish a plan to connect various platforms differentiated from those of similar projects. - We collected basic data to develop macroscopic strategies for building a climate environment data platform construction strategy, planning data-based environmental research projects, and expanding the established platform in the future to make it the KEI-type data platform. - The questionnaire was divided largely into three main themes: data use and utilization, KEI climate environment data platform establishment, and data-based policy research demand. ?The direction for construction is set based on the purpose of using climate environment data, whether there are any difficulties, data quality factors and characteristics, the opinions collected on data and services that should be provided in the platform, and other suggestions. ㅇWe established strategies that can make the platform serve as a “channel” for data utilization and linkage in environmental policy research by conducting a survey on the current status of climate environment data to respond to climate change and preparing a research data management system. -A roadmap to respond to the demands for creating core values was prepared, such as conducting convergence research, conducting strategic research for synergy, and conducting sustainable policy research. -The KEI research data utilization and management roadmap (draft) sets three main goals for data management and utilization and elicits detailed essential elements for promotion: ① establishment of a climate environment data hub, ② conversion of the climate environment data utilization system, and ③ improvement of the data utilization system. ?Establishment of a climate environment data hub (builing an infrastructure, data linkage) ?Conversion of the climate environment data utilization system (building an environmental data collaboration network, a data system for participatory environmental policy, and a data application system) ?Data utilization system improvement (data utilization system improvement, data management system application, data management advancement) ※For details of the KEI research data utilization and management roadmap, refer to ~ . Ⅴ. Establishment of the KEI Climate Environment Data Provision Services ? Overview of the KEI Climate Environment Data Provision Services ㅇBased on the climate environment data inventory, we intend to prepare a data provision service plan and provide services to support decision-making on climate environment policy issues. -We set the scope with the data established by KEI and the platform data on the climate environment provided by other organizations, through which we prepared a plan for providing climate environment data. ㅇIn this study, we propose a method to improve data utilization and accessibility in policy research by preparing keyword-oriented policies and data linkage plans. -Providing customized data to users by diversifying keywords by field is proposed. ? Plan for providing KEI climate environment data ㅇIt is necessary to come up with a practical plan for researchers to use research data efficiently, and to provide a service by organizing the meta-information of major data. ㅇIn this study, the DMP is prepared based on the analysis of the current status of the climate environment data inside and outside the institute, which is connected to create metadata and provided as the pilot data on the research data repository system. -We provide various climate environment data that can be used as a basis for understanding policy issues and making decisions. -In order to improve the utilization of data in policy making, types of data, media information, and related keywords should be included in the metadata. ㅇIn order to develop a search engine to enhance the policy utilization of climate environment data, a keyword dictionary and related algorithms were built with related keywords stored. ㅇTo enhance access to climate change data, we propose a service in the form of a mind map that classifies and provides data by category and keyword frequency. -When providing a mind map, related data is extracted centered on ‘search words’ and classified by category. ?Metadata such as name, keyword, and description of data as well as name of data source are matched with search keywords to preferentially select the range of data that will be used in mind mapping. ?The criteria for primary and secondary classification are the climate change adaptation sector and sub-categories by sector, respectively. The tertiary classification consists of a mind map that provides keywords in bundles based on the frequency included in the data. ? Plan for providing a service linking climate environment policy with data ㅇWe suggest establishing links by giving sufficient amounts of relevant keywords to data through various routes. -Extract relevant keywords from KEI research reports and assign them to each database of major environmental issues -It is necessary to set the scope for keyword management depending on the content and nature of text data, and consider setting the limits to texts reflecting the positions of policy providers or demanders and assigning related keywords. Ⅵ. Conclusion and Policy Recommendations ? Conclusion ㅇThis study is a pilot study to strengthen data-centered responses to climate change and lay the foundation for digital transformation by establishing a data-science response platform strategy in the field of climate environment. ㅇIn the first-year study, the current status of data from KEI and other major organizations that can be used for climate change adaptation by sector was investigated, and additional data that can be used in climate change vulnerability assessment was proposed. ㅇThe second-year study includes the satellite data which are widely used in recent climate change research along with the existing adaptation data. ㅇIn addition, data in sectors such as industry, transportation, and household that can be used for greenhouse gas reduction and climate change mitigation are additionally investigated, and an inventory is built by integrating them. ㅇIt is expected that data utilization will be improved with the establishment of a climate environment data inventory with which it is possible to efficiently provide relevant data when conducting research on climate change response. ㅇThe draft of the research data management system was prepared with basic elements by supplementing the research data management system which focuses on climate environment data and investigating case studies on data management and collection by other institutions. ㅇA DMP-centered research management system was prepared in consideration of in-house research data utilization cases, data scope, the review of DMP format construction cases, and research promotion process. ㅇThis study establishes a data management system that can be practically used in KEI in consideration of DMP preparation for climate environment data management and utilization, metadata template construction and supplementation, DMP and research data submission process, data format, and so on. ㅇIn particular, as an example of climate change response policy, detailed topics for each data sector are set to support research in the field of adaptation, and metadata is established to provide information on the data such as related keywords, data descriptions, and data sources. ㅇTo support for data-based policy, it is necessary to think about which document we should choose to extract keywords and the key is to set texts based on which we can identify related issues and important matters such as media reports and policy-related documents. ㅇIt analyzes the current status of climate environment data to respond to climate change, prepares a research data management and execution system, and presents a realistic approach strategy for how to provide actual data. ? Limitations and points for improvement ㅇIn the long term, it is necessary to make an effort to build a data set that can accommodate the needs of various users along with building an excellent platform that covers the entire environmental field. ㅇIn order to realize data-based policy research, in-depth consideration on what data can be practically used for policy research and how to build it, and continuous efforts to manage research results in databases and preserve them as meaningful outcomes are required. ㅇTo implement the roadmap for developing the KEI climate environment data platform, a large amount of resources including budget and human resources are essential; also, the implementation should be based on the consensus on the need for a data-sharing and a platform for it. ㅇIn overall environmental policy research, it is necessary to prepare a practical data cooperation system to expand the area of data outcomes and increase the utilization of the established data as well as promoting data set establishment projects necessary for policy making and implementation.

Ⅰ. 서론 ? 연구 필요성 및 목적 ㅇ 전 지구적 이상기후 및 자연재해 발생 등 기후변화 현상의 심화는 자연환경뿐만 아니라 인간 활동 영역에까지 다양하게 영향을 미침 ㅇ 최근 우리나라는 국제 사회와 공조하여 2050 탄소중립(net-zero) 목표를 선언하고, 기후변화 대응에 적극 나서고 있음 ㅇ 기후변화는 온실가스를 감축하는 완화(mitigation) 연구와 피해 및 위험을 최소화하는 적응(adaptation) 연구로 구분할 수 있으나, 기후변화 원인은 복합적이기 때문에 상호 보완적인 정책이 필요함 ㅇ 2018년 과학기술정보통신부는 국가 R&D 추진 과정에서 축적되는 연구데이터 관리·공유를 위해 ?????연구데이터 공유·활용 전략??을 수립한 바 있으며, 본격적으로 데이터 집중형 과학(data-intensive science) 시대가 도래함 - 하드웨어 발전, 고성능 네트워크 등 장비의 발달로 많은 연구데이터를 생산하기 때문에 다양한 연구데이터 관리는 효과적인 연구수행의 필수적 요소가 됨 ㅇ 본 연구는 기후변화를 데이터 중심으로 연계하여 대응하는 것으로, 기후변화 연구를 ‘데이터 사이언스(Data Science)’로 전환하는 것임 - 데이터 사이언스는 다양한 형태의 데이터로부터 실제 현상을 이해하고 유용한 지식을 도출하는 과정을 총칭함 - 정보통신기술(ICT), 위성 데이터, 기상 재해석 데이터 등 생성되는 데이터양이 점차 증가함에 따라 이를 연계·활용하기 위한 관련 데이터 확보가 중요해짐 ㅇ 기후변화 대응을 위한 데이터는 다양한 기관에 산재해 있는 데다 환경데이터 분류 표준체계가 부재한 탓에 데이터 활용에 제약 요소가 많으며, 이를 효율적이고 편리하게 활용하는 방안 마련이 시급함 ? 연구 범위 ㅇ 기후환경 데이터의 현황분석, 데이터관리계획(DMP)의 실행체계 구축 및 운영, 기후환경 데이터 플랫폼 구축전략과 차별화된 데이터 제공 서비스를 위한 방안을 마련함 - 위성 중심의 기후환경 응용데이터 현황 및 기후변화 완화 부문의 데이터 조사를 통해 기후변화 대응을 위한 완화-감축 부문의 데이터 인벤토리를 작성하고자 함 - 기후환경 데이터 관리의 실질적 이행체계 구축을 위한 연구데이터 범위 설정 및 DMP 도입과 연구데이터 리포지터리(IDR)를 중심으로 한 KEI형 데이터 관리 추진체계를 구축하고자 함 - 구축된 기후환경 데이터 인벤토리 및 관리체계를 토대로 환경정책연구에 활용 가능한 기후환경 데이터 서비스 제공 방안을 모색하고자 함 ? 본 과제에서 기후환경 데이터는 기후변화 대응을 위한 완화 및 적응과 관련된 공개 데이터로 한정함 ? 누적된 다양한 데이터가 단일 연구과제에서만 활용되는 것을 방지하고, 데이터의 공유 및 활용성을 극대화하고자 함 - 기후환경 데이터 플랫폼 구축을 위한 설문조사와 데이터 공유·활용에 관한 법·제도를 검토하고, 기후변화 데이터를 중심으로 한 정책연구의 현실적 방안을 제시하고자 함 ? 연구 내용 및 방법론 ㅇ 2차 연도 연구는 주요 환경 관계기관의 온실가스 감축데이터를 중심으로 구축·보완하고, 기존 인벤토리 고도화를 추진하고자 함 - 기후환경 데이터 중 위성데이터 산출물과 기상청의 기상·기후 데이터 현황 조사를 통해 기후변화 대응 데이터 범위 확대 가능성을 살펴봄 ㅇ KEI 연구데이터 관리 실행체계 마련 및 구축을 위한 연구데이터 정의 및 관리 필수요소를 도출하고자 함 ㅇ KEI 기후환경 데이터 플랫폼 구축전략 마련을 위한 전문가 의견수렴 및 조사된 연구데이터 관리체계 내용을 기반으로 KEI 기후환경 데이터 플랫폼 구축 로드맵을 마련하고자 함 ㅇ 향후 KEI형 데이터 플랫폼으로 확장하기 위해 수집된 기후변화 대응 데이터의 메타정보를 연구데이터 리포지터리 시스템에 시범적으로 업로드하고, 데이터 마인드맵 시범 서비스를 통해 정책활용도를 제고하고자 함 Ⅱ. 기후환경 데이터 인벤토리 고도화 ? 국내 기후환경 응용 데이터 현황 ㅇ 기후변화는 강수, 운량, 온도뿐만 아니라 식생분포, 토지분포 등에도 큰 영향을 미치며, 이에 대응하려면 일차적인 자료 확보가 적절히 이루어져야 함 ㅇ 국외에서는 미국 항공우주국(NASA)과 유럽 우주국(ESA)을 필두로 대기오염기체와 기후변화 유발기체, 에어로졸, 식생지표 변화 등 다양한 영역을 관찰할 때 위성 자료를 사용함 ㅇ 국내에서도 통신해양기상위성(COMS)의 후속으로 정지궤도복합위성을 발사하고, 위성 관측을 통해 생산된 자료를 기후변화 대응 정책의 기초자료로 활용하고 있음 ㅇ 대표적인 국내 위성으로는 천리안해양관측위성, 천리안위성 2A호, 천리안위성 2B호 등이 있음 - 천리안해양관측위성은 적조, 해빙, 해무, 해양투기모니터링, 해사채취활동, 미세먼지 등에 활용됨 ? 주요 산출물로는 용존유기물, 엽록소, 총 부유물질, 적조지수, 육상식생지수 등 총 13종의 데이터를 생산함 - 천리안위성 2A호는 천리안해양관측위성과 비교하여 다양한 관측이 가능하며, 기상재해의 감시 및 대비가 가능함 ? 생산하는 기상산출물은 총 52종으로 구름탐지, 오존량, 강우강도 등 23종의 기본산출물과 산불탐지, 식생지수, 식생률, 지표면 반사도 등 29종의 부가 산출물을 생산함 - 천리안위성 2B호는 해양환경과 생태계를 관측하고, 한반도 밖의 대기오염물질 등을 감시하여, 기후변화 대응 및 미세먼지 감시를 위한 자료를 제공함 ? 주요 산출물로는 대기보정, 고유광특성, 대기산출물, 해색산출물, 해양산출물, 육상산출물 등 총 26종의 데이터를 생산함 ? 기후변화 대응 관련 데이터 현황 ㅇ 기후변화 대응은 온실가스를 감축하거나 흡수하는 완화(mitigation) 정책과 기후변화 피해를 저감하는 적응(adaptation) 정책의 두 가지 측면을 모두 고려해야 함 ㅇ 기후변화 대응을 위한 에너지, 발전, 온실가스 배출 등 기후변화 완화 데이터 현황조사를 통해 기후변화 완화와 적응정책을 연계하고자 함 ㅇ 기후변화 완화(온실가스 감축) 부문 데이터는 크게 에너지 통계, 국가 온실가스 인벤토리, 기타 연계 및 활용 가능한 데이터로 구분할 수 있음 - 국가에너지 통계종합정보시스템에서는 에너지 밸런스 및 국가에너지 수급 관련 통계를 비롯해 에너지통계 작성 규정에 따른 관련 기관의 통계자료를 연계·통합하여 제공함 - 국가 온실가스 인벤토리에서는 기후변화 대응을 위해 국내 온실가스 배출원·흡수원 및 배출량·흡수량 파악을 위한 데이터를 제공함 - 기타 데이터로는 민·관·학계의 배출량 산정 분석 지원과 온실가스 인벤토리 연계를 위한 교통/수송 및 전력 데이터 등이 제공됨 ㅇ 기후변화 적응 부문 데이터는 국가기후변화적응센터(KACCC)에서 운영 중인 시스템 내에 구축된 데이터를 기반으로 기후환경 데이터 인벤토리를 구축함 - 대표적인 기후변화 적응 시스템인 부문별 기후변화 영향 및 취약성 통합평가 모형(MOTIVE)과 기후변화 취약성 평가도구(VESTAP)에서는 기후변화 적응을 위한 취약성 평가 데이터를 제공함 ㅇ 기상청에서 관측·제공하는 각종 기상관측 자료, 방재기상정보 등은 기후변화의 미래예측과 대응정책 수립과 같은 다양한 분야에서 기초자료로 활용됨 - 기후변화 시나리오는 미래 기후변화로 인한 영향평가 및 피해를 최소화하는 연구의 분석 자료로 활용할 수 있으며, 이는 기후변화 대응 및 적응대책 수립·지원을 위한 필수적인 정보로 활용됨 Ⅲ. 기후환경 데이터 관리 실행체계 구축 ? KEI 연구데이터 관리 개요 ㅇ 2019년 데이터관리계획(DMP: Data Management Plans) 규정이 시행되며 국내 연구데이터를 공유하고 활용하기 위한 노력이 활발히 이루어지고 있음 -주요 선진국을 중심으로 국가연구개발사업 과제의 연구데이터 보존 및 재사용의 성공적 사례가 나오고 있으며, 오픈 데이터 활동이 전 세계적으로 확산하고 있음 -?국가연구개발사업의 관리 등에 관한 규정?에서 연구데이터와 데이터 관리계획을 정의하고, 국가연구개발 사업 수행 시 DMP 제출 요구를 규정하여 국가 차원의 연구데이터 관리 근거를 마련함 ㅇ 연구데이터를 관리하고 서비스하기 위한 핵심 요소로는 DMP 작성지원, 데이터 파일 정리, 데이터 저장, 데이터 공유 및 접근, 데이터 인용, 데이터 관리교육으로 구분할 수 있음 ? 연구데이터의 수집 및 관리 ㅇ 연구데이터는 연구개발과제 수행 과정에서 실시하는 각종 실험, 관찰, 조사 및 분석 등을 통하여 산출된 사실 자료로서 연구 결과의 검증에 필수적인 데이터임 - 연구데이터는 연구 과정에서 생성되는 모든 데이터를 지칭하기 때문에 메일이나 기술보고서 등과 같은 연구 기록과 구별해야 함 - 지속적 연구 활동 지원 및 연구 결과물 보존·공유를 위해서는 연구자가 소속된 연구 기관과 연구자가 활동하는 커뮤니티에서 연구 수행 과정에서 산출되는 데이터 관리가 필요함 ㅇ DMP란 연구 프로젝트 도중이나 종료 후에 프로젝트를 통해 생산·수집된 연구데이터가 어떻게 관리·공유되는지 기술하는 공식 문서를 의미함 - 데이터 수집 전에 DMP를 통해 충실한 데이터 설명이 가능하고, 이는 데이터에 대한 상세 내용을 기억하기 위한 연구자의 노력이 불필요하게 하며 데이터 재사용을 가능케 함 ㅇ DMP는 연구 라이프 사이클에 맞추어 연구계획 단계부터 데이터 생산, 수집, 관리, 보존 및 폐기, 출판, 재사용 등의 모든 과정에서 발생하는 행위임 ㅇ KEI 기후환경 데이터 플랫폼을 개발하려면 연구데이터 라이프 사이클을 도출하고, 이에 관한 세부 내용을 확정하는 것이 중요함 ? 연구데이터 관리 시스템 구축 ㅇ 데이터 리포지터리는 오픈소스로 개발되어 공개된 소프트웨어를 활용할 수 있으며, 대표적으로 DSpace와 NaRDA가 있음 - DSpace는 웹기반 인터페이스 제공을 통해 파일 제출이 쉽고 다양한 파일 수용이 가능하며, 하나의 기관을 넘어 대규모, 다분야 리포지터리로 확장이 가능함 - NaRDA는 한국과학기술정보연구원(KISTI)에서 개발·보급하는 연구데이터 리포지터리이며, 연구자의 데이터 관리 활동 주기를 고려하여 설계 및 구현됨 ? NaRDA는 DMP 제출양식을 작성하고, 이를 게시 및 공유할 수 있음 ? 연구 수행 중의 관리 단계에서는 연구 수행을 위한 데이터를 자유롭게 업로드·다운로드 할 수 있으며, 데이터 설명을 기술할 수 있음 ? 마지막 단계에서는 연구 결과물 공유를 위한 연구데이터 등록이 가능하며, 이를 위해 메타데이터 추출 및 DOI 부여 기능을 제공함 ㅇ 연구데이터는 메타데이터와 원천데이터로 구성되며, 메타데이터는 데이터를 설명하는 자료로 데이터 검색 시스템에서 활용되는 색인 요소임 ㅇ 메타데이터란 데이터에 대한 속성을 기술하고 컨텍스트(context) 및 데이터 품질 정보를 제공하며, 다른 객체나 데이터의 특징을 문서화한 것을 일컬음 ? 연구데이터의 보존 및 공유 ㅇ 디지털 연구데이터를 보존하는 경우 다양한 편익이 발생하며, 보존을 위해서는 인적·물적 자원이 필요함 - 데이터 보존을 위해서는 해당 정보를 수집할 방법을 시스템화하여 제공하고, 보존 및 출판을 위한 영구식별자(DOI, ARK, UUID 등)가 부여되어야 함 ? 가장 많이 쓰이는 영구식별자는 DOI로, KISTI에서 발급하는 DOI prefix를 이용해 데이터를 출판하는 기관이 suffix를 추가하여 데이터를 출판할 수 있음 ㅇ 데이터 출판과 관련하여 연구자의 의지가 반영될 수 있도록 하고, 이때 내부 및 외부 공유 범위 설정과 연구자의 요구 수준을 표현할 수 있는 화면 및 기능 설계가 필요함 ㅇ 연구자의 데이터 리터러시 능력 향상을 통해 효과적인 연구데이터 활용이나 공유, 재사용을 기대할 수 있으며, 연구데이터 공유와 재사용 활성화를 위해 데이터 공개에 대한 보상체계가 마련되어야 함 ? 연구데이터 구축 서비스 사례 및 시사점 ㅇ 한국지질자원연구원(KIGAM)은 연구데이터의 관리체계 부재로 인해 중복 연구가 이루어진다는 사실을 인지하고, 지질 자료 저장소 GDR을 개발하여 운영 중임 - GDR은 데이터 접근 제어 기능과 외부 연동 데이터에 DOI를 발급하고, 연구소 최초로 사업계획서에 DMP 양식을 포함하는 제도를 시행함 ㅇ 한국한의학연구원(KIOM)은 한의약 연구데이터 리포지터리(KMDR)를 구축하고, 이를 운영 중임 - KMDR은 한의약 분야 연구데이터의 체계적인 관리 및 공유를 위한 정보 시스템으로 데이터 관리 지원, 활용 제고를 통해 효율적인 연구수행 지원을 목적으로 구축됨 - 외부 위협으로부터 연구데이터 보호를 위한 암호화 모듈 적용과 DMP 작성 및 관리 기능을 연계하여 전 주기적인 연구데이터 관리가 가능함 ㅇ 국립산림과학원은 ?국립산림과학원 연구사업 관리 규정?(예규 제307호)의 일부 개정(2019.2.11)을 통하여 연구데이터 관리 의무화 조항을 신설함 - 데이터 기반 융·복합 산림과학연구 수행 지원을 위한 적극적인 연구데이터 관리 도모 및 참여 의식 고취를 목적으로 포상계획을 수립함 ㅇ 연구데이터 관리와 거버넌스 체계를 만들려면 연구자와 경영진 인식이 긍정적으로 변화될 수 있도록 지속적인 교육이 필요하며, 선행 기관과 지속적 협력이 중요함 ? KEI 연구데이터 활용·관리 체계 정립 ㅇ 환경정책연구는 데이터 생산 사례가 적고, 사회·자연과학의 융·복합적인 연구 형태로 인해 과학기술계에서 운영 중인 DMP 및 연구데이터 리포지터리 시스템을 적용하는 데 한계가 있음 ㅇ 주요 기관의 데이터 분류 현황을 토대로 KEI 연구데이터는 데이터 종류 및 형식과 데이터 생산 방법에 따라 분류함 - 데이터 종류 및 형식(지표·지수, 정책 DB, 측정·관측, 시뮬레이션, 문헌, 전문가의견, 발표자료·정책문서, 기타 등) - 데이터 생산 방법(내부-생산, 내부-가공, 외부-생산, 외부-가공 등) ㅇ KEI는 연구데이터의 유실 방지 및 보존, 지속가능한 환경정책 수립, 데이터 연계를 통한 다학제 간 융·복합 연구체계 마련, 증거 기반의 정책 의사결정 지원 등을 위해 연구데이터의 체계적인 관리가 필요함 - 데이터 성과 관리를 통한 연구성과 관리 효율화와 연구성과 확산 제고, 데이터 기반의 연구 협력 생태계 조성을 위해 2022년 기본과제 제안 시(2021년 6월 시행) DMP를 도입함 - 원내 최초로 적용된 DMP를 효율적으로 운영하고자 연구데이터는 환경(정책) 연구 과정에서 활용된 자료 또는 결과로 나타난 주요 연구 산출물로 정의함 ㅇ 본 연구에서는 연구데이터 리포지터리를 구축하고 인트라넷 로그인 연동, 메타데이터 등록, DMP-IDR 연계 방안 마련 등을 통해 DMP 중심 데이터 관리체계를 마련함 Ⅳ. KEI 기후환경 데이터 플랫폼 구축전략 ? KEI 기후환경 데이터 플랫폼 구축 개요 ㅇ 데이터 플랫폼 구축을 통해 다양한 연구데이터를 공유하고 활용하고자 노력 중이며, 국가 차원의 연구데이터 활용 촉진과 융합연구 및 오픈 사이언스 등 선진 연구환경을 조성함 ㅇ 데이터는 다양한 분야에서 기하급수적으로 생산되고 있으나 이에 대한 소유권 문제, 정보공개 문제 등이 여전히 산재해 있음 - 데이터를 융·복합적으로 활용하고 각계각층에서 공동 활용하기 위한 법·제도는 미흡한 실정임 - ‘데이터 3법’과 ?데이터기반행정법? 등의 개정 및 시행으로 데이터 산업 활성화 기반이 마련되고 있으나 중복 규제 등의 문제가 발생할 가능성이 큼 ㅇ 본 연구에서는 기후환경 연구데이터 관리와 플랫폼 구축전략 마련을 위해 정보 접근성 및 서비스 측면과 연구데이터 관리 측면에 관한 법·제도 현황을 정리함 -데이터 이용 및 활용에 관한 주요 법·제도로는 ?환경정책기본법?, ?전자정부법?, ?국가정보화기본법?, ?공공데이터의 제공 및 이용 활성화에 관한 법률?, ?지능정보화 기본법?, ?데이터기반 행정법?, ?정보통신융합법?, ?국가연구개발사업의 관리 등에 관한 규정?, ?정보통신망법? 등이 있음 ㅇ 먼저 검토가 필요한 사항인 연구데이터 관리 측면의 데이터 이용 및 활용에 관한 법·제도 개선 필요사항을 도출함 - ?국가연구개발사업의 관리 등에 관한 규정?에 (연구)데이터 관리 권고 조항 추가와 ?데이터기반 행정법?에 기관메타시스템 및 IDR 시스템 구축 권고가 필요함 ? KEI 기후환경 데이터 플랫폼 구축전략 수립 ㅇ 현재 빅데이터 플랫폼 사업이 활발히 진행되고 있으나 다수의 플랫폼에서 기후환경정책연구 수행에 활용 가능한 데이터 획득에는 여전히 어려움이 있음 ㅇ 유사 사업과 차별성을 두고 다양한 플랫폼과 연계 방안을 마련하고자 환경 분야 연구를 수행한 각 매체의 전문가들을 대상으로 설문조사를 실시함 - 기후환경 데이터 플랫폼 전략 수립과 데이터 기반의 환경정책연구를 발굴, 향후 KEI형 데이터 플랫폼으로 확장을 위한 거시적 관점의 전략 수립을 위한 기초 자료를 수집함 - 설문은 데이터 이용 및 활용, KEI 기후환경 데이터 플랫폼 구축, 데이터 기반 정책연구 수요 등 3가지 주제로 구분하여 진행함 ? 기후환경 데이터 활용 목적 및 애로사항 유무, 데이터 품질 요소 및 특성에 관한 설문과 향후 플랫폼에서 제공해야 할 데이터 및 서비스와 기타 제안사항 등 의견수렴을 통해 향후 플랫폼 구축 방향성을 수립함 ㅇ 기후변화 대응을 위한 기후환경 데이터 현황조사, 연구데이터 관리체계 마련 등을 통해 환경 분야 정책연구의 데이터 활용·연계의 ‘통로’ 역할을 수행하기 위한 전략을 수립함 - 연구 간 융합연구 수행 및 시너지 효과 창출을 위한 전략과 지속가능한 정책연구 수행 등 핵심 가치 창출 요구에 대응하고자 로드맵을 마련함 - KEI 연구데이터 활용·관리 로드맵(안)은 데이터 관리 및 활용을 위한 ① 기후환경 데이터 허브 구축, ② 기후환경 데이터 활용체계 전환, ③ 데이터 활용제도 개선 등 목표를 크게 세 가지로 설정하고, 세부 추진 필수요소를 도출함 ? 기후환경 데이터 허브 구축(인프라 구축, 주요 데이터 연계) ? 기후환경 데이터 활용체계 전환(환경데이터 협업 네트워크 구축, 참여형 환경정책을 위한 데이터 체계 구축, 데이터 활용체계 구축) ? 데이터 활용제도 개선(데이터 활용제도 개선, 데이터 관리체계 적용, 데이터 관리 고도화) ※ KEI 연구데이터 활용·관리 로드맵의 세부 내용은 ~ 참조. Ⅴ. KEI 기후환경 데이터 제공 서비스 구축 ? KEI 기후환경 데이터 제공 서비스 개요 ㅇ 기후환경 데이터 인벤토리를 기반으로 데이터 제공 서비스 방안을 마련하고, 기후환경 정책 이슈에 대한 의사결정 지원을 위한 서비스를 제공하고자 함 - KEI에서 기존에 구축한 데이터와 타 기관에서 제공하는 기후환경 관련 플랫폼 데이터로 범위를 설정하고, 이를 토대로 기후환경 데이터 제공 서비스 방안을 마련함 ㅇ 본 연구는 키워드 중심으로 정책과 데이터를 연계하여 정책연구 시 데이터 활용과 접근성이 개선되도록 하는 방안을 제시함 - 분야별 키워드 선정의 다양화를 통해 사용자에 대한 맞춤형 데이터를 제공하는 방안을 제시함 ? KEI 기후환경 데이터 제공 서비스 방안 ㅇ 연구데이터를 연구자들이 효율적으로 활용하기 위한 실질적인 방안이 필요하며, 주요 데이터의 메타정보 정리를 통해 서비스를 제공하는 방안을 마련함 ㅇ 본 연구는 원내외 기후환경 데이터의 현황분석을 통해 DMP를 작성하고, 이를 연계하여 메타데이터 작성 및 DB화하여 연구데이터 리포지터리 시스템에 시범적으로 제공함 - 다양한 기후환경 데이터의 정보 제공을 통해 정책문제 이해 및 의사결정의 근거로 활용하도록 함 - 데이터의 정책 활용성을 높이려면 메타데이터에 데이터의 종류, 매체 정보, 연관 키워드를 포함하여 제공하도록 함 ㅇ 기후환경 데이터의 정책 활용을 높이기 위한 검색 서비스 마련을 위해 관련 키워드를 저장한 키워드 사전 및 관련 알고리즘을 구축함 ㅇ 본 연구는 기후변화 데이터에 대한 접근성을 높이기 위해 카테고리 및 키워드 빈도수를 중심으로 데이터를 분류하여 제공하는 마인드맵 서비스를 제안함 - 마인드맵 형태로 데이터를 제공할 때는 ‘검색어’를 중심으로 연관된 데이터를 추출하고, 이를 카테고리별로 분류하여 제공함 ? 데이터명, 데이터 키워드, 데이터 설명, 데이터 원자료명 등 메타데이터를 검색키워드가 연결하여 마인드맵을 구성할 데이터 범위를 우선적으로 선별함 ? 1차 분류 기준은 기후변화 적응 부문, 2차 분류는 부문별 세부주제로 설정하고, 3차 분류는 데이터에 포함된 키워드 빈도수를 중심으로 묶어 제공하는 방식의 마인드맵을 구성함 ? 기후환경 정책?데이터 연계 서비스 방안 ㅇ 다양한 경로로 데이터 연관 키워드를 충분히 부여하여 연결고리를 만드는 방안을 제시함 - KEI 원내 보고서 수집을 통한 연관 키워드 부여와 주요 환경 이슈별로 활용되는 데이터에 키워드를 부여함 - 텍스트 데이터의 내용 및 성격 등에 따라 키워드 관리 범위 설정이 필요하며, 정책공급자 또는 수요자 입장의 텍스트로 범위를 설정하고 관련 키워드를 부여하는 방안을 고려함 Ⅵ. 결론 및 정책 제언 ? 결론 ㅇ 본 연구는 기후환경 분야의 데이터 사이언스(Data Science) 대응 플랫폼 전략 구축을 통해 데이터에 기반하여 기후변화 대응을 강화하고, 디지털 전환의 기틀을 마련하기 위한 시범 연구임 ㅇ 1차 연도 연구에서는 분야별 기후변화 적응에 활용이 가능한 KEI 및 주요 외부기관의 데이터 현황을 조사하고, 기후변화 취약성 평가에 활용하기 위한 추가적인 데이터를 제안함 ㅇ 2차 연도 연구에서는 기존 적응데이터와 함께 최근 기후변화 연구에 활용도가 높은 응용데이터인 위성 데이터 내용을 포함함 ㅇ 또한 온실가스 감축 및 기후변화 완화에 활용할 수 있는 산업·수송·가정 등의 분야와 관련된 데이터를 추가로 조사하고, 이를 통합하여 인벤토리를 구축함 ㅇ 기후환경 데이터 인벤토리 구축을 통해 기후변화 대응을 위한 연구수행 시 관련 데이터를 효율적으로 제공하여 데이터 활용성을 높일 수 있을 것으로 기대됨 ㅇ 기후환경 데이터를 중심으로 구축한 연구데이터 관리체계를 보완하고, 데이터 관리 및 수집을 위해 타 기관 사례를 조사하여 기본적인 요소들로 연구데이터 관리체계 초안을 작성함 ㅇ 원내 연구데이터 활용 사례, 데이터 범위 및 DMP 양식 구축 사례 검토, 연구 수행 프로세스 등을 고려하여 DMP 중심의 연구관리체계를 마련함 ㅇ 본 연구에서는 기후환경 데이터 관리·활용을 위한 DMP 마련과 메타데이터 템플릿 구축 및 보완, DMP 및 연구데이터 제출 프로세스, 데이터 형태 등을 고려하여 KEI에서 실질적으로 활용 가능한 형태의 데이터 관리 실행체계를 구축함 ㅇ 특히 기후변화 대응 정책 중 하나로 적응 분야 연구 지원을 위해 각 데이터에 대한 부문별 세부 주제를 설정하고, 관련 키워드, 데이터 설명, 데이터 출처 등 해당 데이터의 정보를 제공하기 위한 메타데이터를 구축함 ㅇ 데이터 기반의 정책 지원을 위해서는 어떤 문서를 기반으로 키워드를 설정할 것인가에 대한 고민이 필요하며, 언론, 정책 관련 문서 등 관련 이슈 및 중요사항을 파악할 수 있는 텍스트를 설정하는 것이 핵심이라 할 수 있음 ㅇ 기후변화에 대응하고자 기후환경 데이터의 현황을 분석하고 연구데이터 관리 및 실행체계를 마련하였으며, 실제 데이터를 어떻게 제공할 수 있는지를 현실적인 접근 전략으로 제시함 ? 연구의 한계점 및 보완사항 ㅇ 장기적으로 환경 분야 전체를 포괄하는 뛰어난 플랫폼 구축과 함께 다양한 사용자의 요구를 수용할 수 있는 데이터세트 구축이 필수적임 ㅇ 데이터 기반 정책연구를 실현하려면 정책연구에 실질적으로 활용 가능한 데이터가 무엇이고, 이를 어떻게 구축할 것인지를 깊이 있게 고민하고 연구수행 결과를 데이터화하여 의미 있는 성과물로 관리하는 노력이 지속적으로 필요함 ㅇ KEI 기후환경 데이터 플랫폼을 구축하는 로드맵을 마련했으나 이 로드맵을 이행하는 데는 많은 예산과 인력 등의 자원이 필수적이며, 데이터의 공유문화와 플랫폼이 필요하다는 공감대가 형성되어야 함 ㅇ 전반적인 환경정책연구에서 정책 수립 및 이행에 필요한 데이터세트 구축 사업을 활성화하는 것과 데이터 성과물 영역의 확대 및 구축된 데이터의 활용도를 높이기 위한 실질적인 데이터 협업체계를 마련하는 것이 필요함

