HOME > Browse Articles > Archive

Archive

Journal of the Korean Society for Precision Engineering - Vol. 38 , No. 12

[ REGULAR ]
Journal of the Korean Society for Precision Engineering - Vol. 38, No. 12, pp. 943-951
Abbreviation: J. Korean Soc. Precis. Eng.
ISSN: 1225-9071 (Print) 2287-8769 (Online)
Print publication date 01 Dec 2021
Received 08 Jul 2021 Revised 20 Oct 2021 Accepted 26 Oct 2021
DOI: https://doi.org/10.7736/JKSPE.021.068

데이터센터 에너지 효율화를 위한 급기팬 온라인 예측제어
주민식1 ; 김현아1 ; 이규종1 ; 강지훈2, #
1삼성SDS 데이터분석그룹
2한국산업기술대학교 경영학부

On-Line Model Predictive Control for Energy Efficiency in Data Center
Min Sik Chu1 ; Hyun Ah Kim1 ; Kyu Jong Lee1 ; Ji Hoon Kang2, #
1Data Analytics Group, Samsung SDS
2School of Business Administration, Korea Polytechnic University
Correspondence to : #E-mail: jhkang82@kpu.ac.kr, TEL: +82-31-8041-0687


Copyright © The Korean Society for Precision Engineering
This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
Funding Information ▼

Abstract

It is important to minimize electric energy consumption of a data center that uses enormous electricity for maintaining an adequate indoor temperature. Most data centers have applied the outdoor air cooling method on account of economic feasibility. However, it is necessary that data centers have an efficient control method in order to achieve extra energy savings. In this paper, we propose an artificial intelligence based real-time optimal control method that minimizes electricity consumption and assures safe operation simultaneously. The main idea of our proposed method is to evolutionary search the optimal range of controlled variable during a normally operative condition. Furthermore, an optimal operating condition can be achieved without requiring large-scale data to learn a model. Experimental results demonstrate that indoor temperature of a data center can be constantly controlled safely and cost effectively based on our proposed methodology.


Keywords: Data center (DC), Smart cooling, Computer room air condition, Model predictive model, Optimal control, Evolutionary operation
키워드: 지능적 냉각, 서버룸 냉각 장치, 예측 모델 제어, 최적제어, 진화적 운영

1. 서론

인공지능 기술 발달 및 클라우드 환경의 확대 등으로 IT 자원의 수요가 증가하고 있는 추세이며, 다수의 서버가 대량의 연산을 동시에 처리해야 하는 요구사항이 증대되고 있다. 이는 Data Center (DC)의 전력 부하를 증가시키며, 이에 수반되는 발열로 인한 기기 오작동 등을 방지하기 위하여 DC의 효율적인 냉각 시스템의 구축에 대한 필요성이 인식되고 있다.1 국내에서도 2012년 그린 DC 구축 지침을 마련하여 DC의 신축 및 확장시에 활용 가능한 장비 배치 방법 및 관리 방안 등에 대한 가이드라인을 제공하고 있다. 이와 같이 DC의 에너지 절감을 위한 하드웨어 관점의 접근 방법 외에 기존 설비에도 적용이 가능한 소프트웨어적인 접근을 통한 에너지 절감에 대한 연구들도 활발하게 진행되고 있으며, 특히 DC 공조시스템의 직접적인 제어를 통한 추가 에너지 절감에 대한 필요성 역시 대두되고 있다.2

Durand-Estebe3는 서버의 열 유동해석을 통해 서버 급기팬의 에너지 소비를 추정하고 서버룸의 적절 냉각 온도를 확인하는 연구를 수행하였으며, PID (Proportional Integral Derivative) 제어기를 활용하여 급기팬의 풍속을 제어하고자 하였다. Chen4은 서버룸의 온도를 실시간으로 예측하고, 이를 바탕으로 팬과 CARC (Computer Room Air Conditioning) 시스템의 소비전력을 최소화하도록 제어하는 PTEC (Predictive Thermal and Energy Control) 시스템을 제안하였고, 냉방 및 순환 에너지 소모를 약 30% 절감할 수 있음을 확인하였다. Fang5은 MPC (Model Predictive Control) 기법을 활용하여 DC의 에너지 효율을 최적화 하는 연구를 수행하였으며, 시뮬레이션 연구를 통해 DC의 에너지 소비를 약 24% 절감할 수 있음을 증명하였다.24

대표적인 제어기인 PID의 경우 간단한 구조와 우수한 성능으로 실제 현장에서 많이 쓰이고 있지만, 매개변수 튜닝의 어려움과 변수간 상호작용이 존재하는 경우 활용성이 떨어진다는 현실적인 문제가 존재한다.6,7 이에 반해 MPC는 수학적 모델을 기반으로 한 PID에 대비하여 정확하고 안정된 응답을 얻을 수 있으며, 동시에 시계열적 반응 변화에 대해 해결할 수 있다는 점이 장점이다. 반면 단점으로는 최적해가 쉽게 수렴하지 않거나 수렴하기까지 걸리는 시간을 일반적으로 예측하기 어렵기 때문에 실시간성이 요구되는 제어 문제에 적용되기 어려운 점이 존재한다.8,9

MPC는 기본적으로 폐쇄루프 기반 유한 구간의 관측된 정보만을 활용한 선형 2차 제어 방식을 따르기 때문에 시스템 식별화를 위한 사전지식을 요구한다. 하지만 실제 현상에서의 비선형성은 수학적으로 반영이 어렵고 동시에 높은 불확실성(Uncertainty)을 갖게 되어 모델의 높은 성능(정확성)을 기대하기는 어렵다. 이에 최근 들어 심층학습(Deep Learning)을 이용한 모델링을 통해 대량의 무작위 탐색을 실행, 제어 공간에 대한 전역민감도(Global Sensitivity)를 학습하여 높은 성능을 보여주는 연구가 많이 진행되고 있다. 하지만 이러한 방법론 역시 오프라인의 학습데이터가 미래의 실운영중인 시스템의 상태역학관계와 동일해야 한다는 가정과 운영 중인 DC에 무작위 오프라인 샘플링을 병행해야 한다는 문제점을 갖고 있다. 결론적으로 대부분의 건물 냉각과 관련된 사전 연구들이 과거 데이터와 시뮬레이션에 의존한 결과를 바탕으로 하기에, 예측 모델의 불확실성에 대한 고려가 부족하여 실제 적용에 있어 한계점이 존재한다.10-13

본 논문에서 제안하고자 하는 기법은 시스템 식별에 대한 사전지식이 요구되지 않는 데이터 의존형의 온라인 선형 모델 예측제어(On-Line Linear Model Predictive Control) 방식으로 과거의 모든 데이터를 이용하지 않고, 불필요한 과거데이터는 삭제하여 필요한 학습데이터를 자동 선별하는 방식을 이용한다. 선별된 학습데이터를 이용하여 예측 모델을 생성 후 비용함수를 최소화하고, 허용 임계치를 위반하지 않게 구속 조건 함수를 제어 작업을 각 시간 단계마다 연속 수행하는 방식을 제안한다. 선별적인 소량의 데이터만 활용하여 점진적으로 에너지 효율을 최소화하는 제어가 가능함을 보여줌과 동시에 최적제어의 해공간에 대한 추가적인 신규 실험으로 인한 DC의 운영을 멈추지 않아도 된다는 장점이 있다.

본 논문의 구성은 다음과 같다. 2장에서는 본 연구와 관련된 다양한 연구의 동향에 대하여 기술하였으며, 3장에서는 본 연구의 제안한 온라인 MPC에 대하여 설명하였다. 4장에서는 연구의 실증을 위하여 실제 DC의 에너지 최적 제어에 적용해본 결과에 대하여 서술하였고, 마지막으로 5장에서는 결론 및 향후 연구 방향에 대하여 서술하였다.


2. 관련 연구

시스템 식별화를 위해 역학관계가 알려진 경우 최적의 정책은 일정한 선형 상태 피드백에 의한 동적 계획법(Dynamic Programming)을 활용하여 효율적으로 해결할 수 있다고 알려져 있다.14

제어방식은 자연계(Nature System)의 외부 반응 유형으로 크게 개방루프와 폐쇄루프의 형태를 갖고 있다. 주로, 개방루프 접근법은 완벽히 학습된 역학 모델(Physics Model: Computer Fluid Dynamics, Data Driven Model: Machine Learning)을 이용하여 시스템을 제어하는 반면, 폐쇄 프는 매 시점마다 환경의 피드백을 받아 역학 모델의 오류(Error)를 개선하면서 시스템을 제어하는 방식으로 정의할 수 있다.15

2.1 폐쇄루프(Closed Loop) 선형예측제어

폐쇄루프 접근법은 선형 2차 제어(Linear Quadratic Control) 방식으로, 제어하고자 하는 물리적 변화는 선형(Linear)으로, 비용함수(Cost Function)는 2차(Quadratic)로 가정하여 제어하는 방식이다.16-20 일반적인 간단한 폐쇄루프 제어방식은 각 단계에서 상태 모델(State Model)을 갱신하여 실제 물리적 반응을 대체하는 형태로 제어법칙을 적용하는 방식이다. 함수의 형태가 비선형성(Nonlinearity)이 그리 크지 않고 볼록(Convex)하다면 전역 최적해(Global Optimum)도 찾을 확률도 높으며, 순차적인 조정을 통해 제어 효율성을 향상시키는 방식이 특징이다.

하지만 선형 2차 모델이 실제 역학 관계의 불확실성에 대해 신뢰성을 보장하기 어렵다는 한계점들이 지적되어 이런 문제에 대한 해결책으로 각 반복적인 최적화 단계에서 최소 후회경계(Feasible Regret Bound) 집합을 구하고, 해당 해 공간 내에서 제어하는 방법들이 연구되었다.21 하지만 후회경계를 만족하는 공간을 계산하기 위한 별도의 실험비용(Experimental or Computational Cost)이 과도하다는 점이 실시간 제어가 필요한 영역에서 주요 한계로 지적되었다.27

추정된 최적해로 상태 모델을 갱신하여 역학관계를 학습하는 방법으로써, 최적실험계획을 이용하는 방법이 존재한다. 이 기법은 각 단계마다 실험계획법에 의해 결정론적(D-Optimality) 샘플링을 수행하여 더 많은 신규 실험 데이터로 수리 모델의 업데이트와 최적해를 탐색하는 진화적 운영제어를 목표로 한다.22

대표적으로 반응표면 모델(Response Surface Model, RSM)을 시계열에 따라 생성하며 순차적으로 해당 모델의 적합도를 개선해가며 최적해를 계산하는 방법이다.22-24 또 다른 접근법으로 해 공간의 사전확률분포를 기반으로 확률적(Stochastic) 샘플링을 이용하는 톰슨샘플링25-27 기반의 방법론이 제안되었지만, 결정론적/확률적 접근법 양측 모두 탐색하는 신규 실험점이 안전한 사전확률에서 생성된다는 가정과 미처 탐색하지 못한 제어공간에 대한 불확실성(Epistemic Uncertainty) 문제를 야기할 수 있다는 한계점이 존재한다. 소량 샘플에 의한 지역적 민감도 정보도 전체 제어 공간의 전역 민감도와 크게 다르지 않게 때문에 안정성이 크게 문제되지 않는다는 가정을 하게 되는데, 추정 대상인 역학 모델이 복잡한 경우에는 결국 매개변수가 수렴되지 않거나 잘못된 모형으로 학습될 수 있기 때문에 샘플링에 의한 탐색 방법은 해의 안정성을 보장하기가 어려워 운영 중인 DC에 실적용에는 여러 한계가 지적되었다.28

2.2 개방루프(Open Loop) 선형예측제어

전통적인 개방루프 제어기법은 시스템설계가 간단하여 제어 시스템이 제작비용이 간단하고 매번 피드백(출력) 측정이 불필요하다는 장점이 있다. 하지만 외란(Disturbance) 변화에 제어시스템이 대응이 어려우며, 목표값과 오차가 커지는 발산현상으로 인해 실제 출력 정보를 활용할 수 없는 특수한 영역에서만 한정적으로 적용되어 왔다.16

하지만 최근 심층신경망이나 강화학습을 통한 역학관계를 학습하여 탐색적인 제어값의 입력설계와 추정 오류분석을 병행하는 형태의 방법이 제안되며 새로운 개방루프 제어 기법으로써 여러 분야에 적용되고 있다.27

보다 정확한 시스템 식별을 위해서는 정교한 상태 모델 학습이 필수적이며 마코비안(Markovian) 계열의 무작위 샘플링(eg. MCMC)을 통해서 연속된 상태 시퀀스를 학습하는 방식이 제안되었다. 이 기법들은 수 시간 동안 무작위화된 탐색(Randomized Exploration)을 수행하여 대규모 DC에서 온도와 공기 흐름을 성공적으로 제어할 수 있다는 것을 보여주었다.29-31

앞서 언급한 폐쇄루프 계열의 연구에서도 별도의 샘플링을 통한 최적해의 탐색 방법론이 제안되었지만 시간 흐름과 병행하는 소량의 실험으로는 역학관계의 비선형성을 모델에 충분히 반영하기가 어려운 것이 현실이다. 이에 반해 무작위 탐색은 수많은 제어조건들을 마코비안(Markovian) 룰에 의해서 생성하여 시뮬레이션하는 것이기 때문에, 제어변수의 변화 범위가 매우 크고 제어변수간 비선형적 교호작용에 해당하는 조건까지 실험이 가능하다. 따라서 대부분 제어값의 변화와 그에 따른 반응 변화에 수반되는 에너지 비용이 개선되도록 전역민감도(Global Sensitivity Analysis)를 학습한 비선형 예측 모델을 구축한다. 따라서 확률적으로 전역 최적해를 찾을 가능성이 높기 때문에 우수한 성능을 기대해볼 수 있다.32

하지만 제어변수를 크게 변화시키는 무작위 샘플링의 경우 학습비용이 일반적으로 매우 높으며 무작위로 도출된 해가 안전 범위를 벗어날 확률이 높아 DC의 운영 안정성에 큰 손해를 미칠 수 있다는 점이 지적되었다.33

정리하자면, 폐쇄루프/개방루프 방법론 양측 모두 저차원의 상태 모델과 단순한 탐색기법을 이용 시에 DC 서버 룸 내부는 시간에 따라서 비선형 열유동 거동이 지속적으로 변화하기 때문에 정확한 제어에 대한 이슈가 발생할 수 있다. 신규 제어값의 신뢰도에도 한계가 발생할 여지가 있다.


3. 데이터 센터 냉각

대부분의 DC는 ASHRAE (American Society of Heating, Refrigerating and Air-Conditioning Engineers)의 권장 온도보다 낮은 Set-Point (SP)를 설정하여 운영하며,34 DC의 에너지효율을 평가하는 전력효율지수(Power Usage Effectiveness, PUE)는 식(1)과 같다.

PUE=Total Facility PowerIT Equipment Power(1) 

Fig. 1은 ASHARE 표준을 따르는 일반적인 DC의 냉각 루프구조를 보여주며, DC를 측면에서 바라본 모양으로 도식화한 그림이다. 본 논문에서 분석 대상으로 선정한 DC의 경우 직접외 기냉각시스템(Direct Air side Economizer) 방식을 활용하고 있으며, 이는 외기온도가 실내 환기온도보다 낮을 경우에만 직접 서버 룸 내부로 유입되는 방식이다. Fig. 1의 외기입구댐퍼(EAT, EAH)가 열리고 냉기 공급팬(SFR)을 통과하여 적절한 속도를 가지고 서버룸 통로(CZT)를 통과한 뒤 개방된 배기댐퍼(LAT)를 거처 외부로 유출되는 방식이다. 외기가 직접 유입되기 때문에 가습장치가 필요하고 필터를 필수적으로 설치해야 한다.


Fig. 1 
DC cooling loop: Heat exchange structure that inhales cold ambient air through the incoming damper and passes through the server room to the outlet damper using the cold air supply fan

Figs. 2는 서버 룸의 내부 구조를 도식화하여 나타낸 것으로 1의 CZT에 해당하는 영역을 나타내고 있다. 주요 상태변수는 서버 룸의 통로 온도인 SAT 값이며 SAT를 SP보다 낮게 제어하면 DC가 최적의 효율성으로 작동하고 손상을 방지할 수 있다. 따라서 SP 이하의 SAT를 유지하면서 최소의 소비전력을 가지는 냉기공급 팬의 속도를 시간에 따라서 동적으로 자동 제어하는 방법이 필요하다. 각 상태변수와 제어변수에 대한 설명은 Table 1에 기술하였다.


Fig. 2 
Cooling Unit of Datacenter, CRAC works for a row and prediction is more easy and energy effective when the power density is high

Table 1 
State and control variable dependencies
Variable Type Description
SP Constant Set-Point, Target temperature
EAT State Entering air temperature
EAH State Entering air humidity
LAT State Leaving air temperature
CZT State Cooling zone temperature
SFR Control Supplying fan rate


4. 온라인 모델 예측 제어 방법론

본 연구를 통해 제안하는 기법은 DC 운전을 멈추지 않고, 최소의 실험비용으로 안전하게 진화적 제어를 하는 특징을 갖고 있다. 제어인자와 상태인자간 변동을 선형 근사 모델(Linear Approximation Model)을 이용하여 학습하고 서버 룸 온도 상태를 매분마다 예측한다. 이후, 예측 모델의 비용함수를 최소화하는 탐색을 수행할 때 SP를 위반하지 않기 위해 안전성을 보장하는 제한 조건을 이용한 수치최적화 기반의 제어기법이다.

본 기법의 핵심 가정은 시간에 따른 대상 시스템의 열/유체 물리거동 비선형성(Nonlinearity)이 급격히 발생하지 않는다는 점과 제어값의 변화를 작게, 즉, 민감하게 조정할 수 있다는 두가지 조건으로써, 제어 파라미터에 대한 예측오차의 불확실성이 과도하게 크지 않은 경우를 상정한다.

실시간 MPC 적용 전의 초기 제어상태는 안전한(In-Control)상태라고 가정하며, 누적된 과거 데이터를 이용하여 예측된 미래상태공간에서 안전한 변화 방향과 크기를 지속적으로 조정하여 DC 에너지 효율성을 향상시킴을 목적으로 한다. 제안하는 기법에 대한 프로세스 프레임워크는 Fig. 3과 같이 구성되어 있다.


Fig. 3 
Flowchart for finding the optimal control solution by the proposed technique

Fig. 3의 DB에는 13개월간 일정 시간마다 변경된 제어인자(급기팬 속도)와 상태인자(서버 룸 온도)들의 과거 데이터가 저장되어 있다. Fig. 3(a) 단계는 상태 예측 모델(State Prediction Model)의 하이퍼 파라메터(학습의 이동 구간(Window Size), 학습율(Learning Rate) 등)를 과거데이터를 이용하여 성능오차가 최소화되는 매개변수(θ)를 결정한다. Fig. 3(b) 단계는 시계열 외부 대기 온/습도 인자(OAT, OAH)와 급기팬 속도 인자(SFR)가 합쳐진 다변량 시계열 모델의 모수를 추정하는 것으로 이를 온라인 모델 학습이라고 통칭하며 Fig. 3(a) 단계에서 결정한 하이퍼 파라메터값들을 학습할 때 이용된다. 온라인 학습의 특성은 서버 룸 온도상태(SAT, x[t])가 변화가 발생하여 실제 상태인자값이 추가될 때 이전 상태인자 데이터 일부를 제거한 뒤 새롭게 모수 추정을 재수행하는 방식으로 정의할 수 있다.

Fig. 3(c) 단계는 생성된 온라인 상태의 예측 모델링으로써, 비용함수를 계산하고 수리적 탐색기법을 이용하여 최소비용을 가지는 제어 조건 ut,M*와 최소비용과 제한 조건 g(ut,M*), J(ut,M*)을 각각 계산하는 과정을 포함하고 있다. 여기서 계산된 최적제어 점 ut,M*는 근사 최적해이자 동시에 신규 실험 점이기 때문에 DC 제어 장치에 타겟 정보로 전달되어 급기팬의 회전 속도를 제어한다. 제어 조건이 변경된 5분 이후에는 서버 룸 내부가 정상 상태가 되며, 이 시점에서 각 서버 룸 온도들을 다시 계측하여 Fig. 3(b)로 다시 전달하여 상태 모델을 업데이트하는 피드백 과정을 거친다.

4.1 실시간 상태 예측(On-Line State Prediction)

시간 t 시점에서 모든 상태, 제어, 외란에 대한 각 인자들을 x[t], u[t], θ[t] 벡터로 정의한다. x[t]은 서버 룸 상태인자(LAT, CZT)이며, 자기상관(Autocorrelation)성을 갖는 시계열 상태변수로 외부대기 온/습도(EAT, EAH)의 변화에 영향을 받는다. u[t]는 급기팬 속도(SFR)를 표현하는 제어변수로 서로 독립이 아닌 다변량 상관성을 갖게 된다. 그리고 θ[t]는 외란요소로 제어가 불가능한 오차이다. 그리고 선형 모델을 활용하여 DC 내 열과 유체의 물리 현상에 대한 역학관계를 모델링한 것이 아래 식(2) 이다. 다변량 시계열 구조를 가지는 예측오차를 줄이기 위해서 모든 학습데이터를 이용하는 배치학습법을 쓰지 않고, 최근의 상태를 반영하는 데이터 구간만 학습하는 온라인학습법을 이용하였다.

xt=k=PTAkxt-k+k=PTBkut-k+Ckεt-k(2) 

여기서 Ak, BkCk는 적절한 선형 모델의 매개변수 행렬이다. 실제 서버룸의 물리 거동은 열/유체 역학에 의해 일반적으로 설명되고 있듯 선형관계로 표현하기에 한계가 있다. 하지만 기존 연구24에서도 설명된 바와 같이, 상태반응이 비선형 변화 거동이 크지 않고, 제어 변화량이 적절하게 점진적으로 변경되는 경우 자연현상에 대한 선형근사 만으로 충분히 효과적인 제어에 사용될 수 있다.

4.2 실시간 최적 제어(On-Line Optimal Control)

최적제어 문제는 일반적으로 시간 L 궤도 내의 비용함수를 최소화하는 제어벡터 ui*를 구하는 것으로 식(3)부터 식(6)과 같은 최적제어 정식화를 제안한다. 비용함수는 2개의 성능지수를 가지는 다중목적함수로 구성하며 J1은 서버 룸 최근 온도와 SP(xsps)와 차이 값들의 합을 의미하며, 두 변수간 차이가 최소화하는 것을 목적으로 한다. J2는 소비전력을 나타내는 것으로 각 급기팬에 걸리는 토크 값의 총합으로 표현되며 급기팬 속도에 비례한다. xspS, umaxCJ1, J2 각각에 대한 스케일링 파라메터이며 스케일링된 J1J2의 총합을 최소화하는 ui*를 t 시점마다 최적 조건을 찾아내는 것이다.

minimize w1J1xist,ui*+w2J2xist,ui*(3) 
with J1xist,ui*=t=pp+Li=1Msxist-xspsxsps(4) 
J2xist,ui*=t=pp+Li=1Msxist-xspsxspss.t ε+xist-xsps<0(5) 
find ui*;i=1 to Muic=URnuminc,umaxcp<t<p+L,cfan,sCZT,EAT,EAH(6) 

상태 모델의 불확실성 인자인 ε[t]는 실제 물리적 제어실험이 이루어진 후에 산출되는 오차이다. 따라서 상태 예측 모델로 도출된 근사최적해(Asymptotic Optimal Solution)는 실제 물리제어 후 SP를 위반하는 즉, 안전 임계치 위반 문제를 발생시킬 수 있다. 따라서 t 시점에서의 선형근사를 이용하여 안전 임계치 위반확률을 줄일 수 있는 공간 탐색을 하기 위한 방법이 필요하다. 본 논문을 통해 제안하는 기법은 제약 조건으로 상태변수 xist가 SP보다 ε만큼 마진을 가지는 최적제어 조건 ui*를 탐색하는 방식을 적용한다. 위에 제시한 제한 조건을 이용하여 제어조건을 탐색 시 최우선 순위로 SP를 위반하지 않는 안전한 탐색 공간을 근사적으로 계산한 뒤 비용함수를 최소화하는 최적해를 결정하기 때문에 비용함수의 성능은 상대적으로 낮아질수 있으나 안전한 유효 공간에서 최적해를 계산한다는 신뢰성을 확보할 수 있다.


5. 실험 결과

실제 DC를 대상으로 PID 제어기와 제안한 온라인 MPC 제어기의 성능을 비교하였다. MPC의 제어성능은 상태 예측 모델에 매우 민감하기에, 실험에 사용된 온라인 예측 모델의 정확도(Accuracy)부터 실제 값과 비교를 통해 유용성 여부를 사전에 검토하였다. 가동 중인 DC를 대상으로 각기 다른 방법의 성능을 비교하는 목적 하에, 실험에 있어 비용과 상태에 영향을 미치는 제어 불가능한 다양한 환경외란에 대한 변인통제가 최대한 고려되었다.

DC 냉각에 대한 주요 환경적 외란요인은 날씨, 하루 중 시간에 따른 서버 온/오프, 서버 하드웨어 노후화, 업무시간에 따른 접속 부하 등이 있으며 유의한 비교를 위해 변인통제를 하였으며 서버 온/오프 조정은 하지 않고, 접속한 사용량이 동일한 시간영역 대와 타 제어인자(냉각기, 창문 개방 등)들은 통제를 하였고, 실험이 이루어지는 시간은 대기온도가 상승하는 시간대(소비전력이 상승하는 구간(12:00-14:00))를 선정하였다.

5.1 상태 예측 모델 성능평가

일반적인 기계학습 이론에 의하면 최대한 많은 데이터를 학습시킬수록 좋은 성능을 보장한다.35 하지만 시계열성을 가지는 모델 학습 문제에서는 주어진 과거의 모든 데이터를 한번에 학습하는 기법인 배치학습법(Batch Learning)으로 하는 경우 현재의 상태거동과 다르게 반응했던 과거 데이터의 샘플 비율이 높아 최근의 현상에 대한 학습성능이 낮을 수 있다.

본 연구에서는 13개월치의 전체 데이터를 대상으로 배치학습법으로 상태 예측 모델을 학습한 경우 서버룸의 온도/습도의 예측 정확도는 각각 84.87, 84.74%를 보였으며, 예측오차는 ±2.74, ±2.69oC를 보여 정교한 예측제어를 위한 대리 모델(Surrogate Model)로써는 충분치 않음을 보였다.

반면, 하이퍼파라미터(Hyper-Parameter) 최적화를 통하여 3일이라는 이동 학습 구간(Moving Window)을 선택한 온라인 예측모델은 온도/습도의 예측정확도가 각각 98.84, 96.22%를 보였으며, 오차는 각각 ±0.30, ±0.33oC로 상대적으로 정확한 결과를 나타내었다. Figs. 4(a)4(b)는 특정일의 서버 룸의 온도/습도의 예측과 실측치 간의 차이를 그래프로 나타낸 것으로 제어에 앞서 모델이 높은 수준의 정확도를 보임을 확인하였다.


Fig. 4 
Trend graph of state variables during steady-state

5.2 제어 모델 성능평가

외기를 활용한 서버 냉각 모드인 경우 일반적으로 관리자에 의해서 급기팬 속도는 대부분 높게 조정하며, 외기 활용으로 충분히 냉각이 되지 않는 수준의 발열은 내부 Fan을 활용한 PID 제어 기반의 냉각 기법으로 해결한다. 따라서 외기 냉방 모드에서 대기온도가 일정 수준 이상 상승하면 내부 PID 냉각으로 인한 부하가 증가하여 소비전력이 커지는 것이다. 따라서 에너지효율을 위해서는 외기를 최대한 이용해야 하며, 이를 위해 외기의 실시간 관찰과 그에 따른 급기팬의 속도 제어가 필요하다. 하지만 24시간 변화하는 시계열 외기정보와 서버 온도간 반응을 관찰하면서 수동적으로 제어하는 것은 매우 비효율적이라 할 수 있다.

Table 2의 SFR은 제어인자로 급기팬 속도값을 의미하며 풍량을 제어하는 변수이다. CZT¯, CZT는 서버 룸 내부의 예측값(Predicted Value)과 실제 값(Actual Value)이다. 예측 모델에 대한 평균절대오차(Mean Absolute Error)는 0.24oC로 해당 모델을 통해 제어하기에 적정한 것으로 사료된다.

Table 2 
Value of the output control-state variable
Time SFR1 SFR2 SFR3 SFR4 SFR5 SFR6 SFR7 SFR8 Sum of SFR [%] Actual CZT [oC] Predict CZT [oC]
PID control 50 70 50 45 80 50 50 40 435 25.9 25.8
11:35 am 40 80 40 40 40 80 40 40 400 26.3 26.5
11:45 am 40 80 40 40 35 80 40 40 395 26.7 26.2
11:50 am 50 80 50 40 30 80 40 40 410 25.9 25.6
11:55 am 50 80 50 35 30 80 40 40 405 26.6 26.9
12:05 am 50 80 50 40 40 80 40 40 420 25.8 25.8
12:30 am 40 80 40 40 40 80 40 40 400 26.2 26.7
12:50 am 40 80 50 40 40 80 40 40 410 25.7 25.8
13:20 am 40 80 40 40 40 80 40 40 400 26.9 26.8
13:25 am 40 80 50 40 40 80 40 40 410 25.4 25.7

일반적으로 외부 대기온도가 상승하면 이에 비례하여 급기팬들의 속도를 일괄적으로 증가시킨다는 것을 가정할 때 특정 제어변수는 큰 변화폭을 야기하며, 다른 변수들 중 민감도가 낮은 제어변수는 적은 변화를 가질 것이라고 추정이 가능하다. 본 연구에서는 기존 관리 방법론 대비 얼마나 개선된 최적 해가 도출될 것인가를 관점으로 실험을 진행하였다. Table 2의 첫 번째 최적제어 결과(11:35 시간대), 초기 PID 제어 조건(11:30) 대비 2개의 SFR3, SFR7만 80% 이상으로 속도를 증가시키고, 나머지 6개 급기팬 속도는 40% 이하로 내리는 최적해를 도출하였다. 이 시점의 온도상태에 대한 제어변수 SFR[3,7]의 민감도는 속도를 올릴수록 냉각이 된다는 (+) 방향을 갖고, SFR[1,2,4,5,6,8]의 민감도는 급기팬 속도를 내릴수록 냉각이 된다는, 즉 (–) 방향을 가진다는 것을 기존 데이터로부터 학습한 것으로 보인다.

급기팬의 속도를 일괄적으로 상승시키는 제어 조건은 특정 서버 존에 난류현상(Fluid Turbulent Transition)을 발생시켜 오히려 냉각에 방해가 되는 효과를 보이는 것으로 추정되며, 이는 비용(목적함수)함수가 커지는 방향으로 예측되기 때문에 MPC의 최적화 알고리즘이 이를 회피한 것으로 분석되었다. 이런 제어인자의 민감도에 대한 정보는 매 시점마다 변화하며 제어인자와 상태인자간 복잡한 다변량 시계열 관계를 머신러닝 모델기반으로 학습을 선행할 경우, 기존의 전문가보다 실제 환경적 변화를 반영한 개선 효과를 보일 수 있다는 점에서 효용성을 찾을 수 있다.

5.3 실험결과 - 효율성 비교

Fig. 5는 제안한 기법을 구현(Brightics AI 솔루션, Samsung SDS36)하여 실제 DC의 급기팬 제어기와 연동하여 실행하는 예제 화면이며, 제어변경 시점을 기록한 것인 Table 2이다.


Fig. 5 
A screen capture (Brightics AI) of running display with actual DC controller and on-line MPC algorithm

Fig. 6Table 2의 실험 구간의 SFR을 소비전력으로 변환하여 그래프로 표현한 그래프이다. Fig. 6의 왼편(마커▲, 07:00-10:00) 구간은 PID 제어 모드 운영 중일 때의 소비 전력이며, 6의 중앙(마커●, 10:05-14:00) 구간은 MPC 제어 모드일 때의 소비전력을 의미한다. 오른편(마커▲,15:00-17:00) 구간은 PID 제어 모드로 다시 복구된 것으로 그래프상 3단계로 구분되고 있다.


Fig. 6 
Experimental result of consumption power using PID control and MPC control methods

초기 PID 제어 구간의 평균 소비전력은 21.38 KW였으며, 온라인 MPC 제어 구간은 평균 19.54 KW의 소비전력이 사용되었다. 즉, MPC 제어를 통해 8.61%만큼의 소비전력 감소가 가능함을 확인하였다. PID 방식으로 복구된 이후 평균 21.56 KW로 소비전력이 증가한 것으로 볼 때, 본 논문의 제안 기법이 효과적으로 동작함을 확인하였다.

Fig. 7은 MPC 제어 전후의 서버룸의 온도와 외부 대기온도의 시간에 따른 추세 변화를 나타내고 있다. 제어 구간에서의 대기온도는 점진적으로 증가하였지만 MPC 제어 결과 서버룸의 온도가 오히려 기존 대비 평균 약 0.15°C가량 내려가는 결과를 도출하였다. 데이터를 기반으로 추론된 모델과 이를 이용한 제어 결과는 기존의 전통적인 관리기법보다 제안하는 방법론이 실용적인 가치가 있음을 보여주고 있다.


Fig. 7 
Trend graph of state (SAT, EAT) variables during PID/MPC controlling


6. 결론

본 연구에서는 DC 냉각제어를 위해서 외기냉각 방식을 이용한 온라인 MPC 기법을 제시하였다. 본 논문의 제안기법은 고비용을 요구하는 Off-Line 학습이 아닌 간단한 선형근사 모델을 이용한 점진/진화적 제어 방식이다. 소량의 학습데이터를 이용하여 최적 제어 값을 능동적(Active)으로 탐색할 경우 대규모 서버층의 온도와 공기 흐름을 효과적으로 조절하기에 충분하며, 일반적으로 사용되고 있는 PID 제어기보다 비용 측면에서 효율적이며 실가동 중인 DC에도 바로 적용 가능하다는 점에서 과학적 관리 방법으로써 그 가치를 입증하였다.

본 연구를 진행 중 복잡한 신경망과 같은 대용량 모델을 사용하여 공냉식 제어 성능을 더욱 향상시키는 방안을 검토하였다. 하지만 비선형성과 비용함수가 다중목적 비용함수를 가진다는 점, 그리고 제어기의 불확실성들이 실제 실험 결과에서 예측 오차를 발생하는 요인들이다. 따라서 이런 다중 목적 비용 함수의 비선형성과 제어기의 불확실성을 고려한 Robust MPC 기법에 대한 연구가 필요하다.


NOMENCLATURE
PUE : Power Usage Effectiveness
SP : Set Point
EAT : Entering Air Temperature
EAH : Entering Air Humidity
LAT : Leaving Air Temperature
CZT : Cooling Zone Temperature
SFR : Supplying Fan Rate
x[t] : State Variable at Time t
u[t] : Control Variable at Time t
θ[t] : Disturbance Variable at Time t

Acknowledgments

연구는 2021년도 과학기술정보통신부의 재원으로 정보통신산업진흥원의 지원(No. S0317-21-1002)과 2021년 과학기술정보통신부의 지원(No. 2020R1F1A1074947)에 의한 연구임.


REFERENCES
1. Cho, J.-K. and Kim, B.-S., “The Cooling and Air Distribution Systems for the Optimal it Environment Control in the (Internet) Data Center,” Journal of the Architectural Institute of Korea Planning & Design, Vol. 24, No. 2, pp. 313-320, 2008.
2. Choi, Y., Park, B., Choi, E., and Moon, J., “Analysis of Air Conditioning Methods for Providing Optimal Thermal Environment in Data Center,” Korea Institute of Ecological Architecture and Environment, Vol. 18, No. 6, pp. 97-102, 2018.
3. Durand-Estebe, B., Le Bot, C., Mancos, J. N., and Arquis, E., “Data Center Optimization Using PID Regulation in CFD Simulations,” Energy and Buildings, Vol. 66, pp. 154-164, 2013.
4. Chen, J., Tan, R., Xing, G., and Wang, X., “PTEC: A System for Predictive Thermal and Energy Control in Data Centers,” Proc. of the IEEE Real-Time Systems Symposium, pp. 218-227, 2014.
5. Fang, Q., Wang, J., Zhu, H., and Gong, Q., “Using Model Predictive Control in Data Centers for Dynamic Server Provisioning,” IFAC Proceedings Volumes, Vol. 47, No. 3, pp. 9635-9642, 2014.
6. Lee, J.-W., Yoon, J.-H., Yang, I.-H., Lee, K., and Oh, J.-E., “PID Vibration Control of Precision Production Facilities,” Proc. of the Korean Society of Precision Engineering Conference, pp. 227-228, 2009.
7. Unar, M. A., Murray-Smith, D., and Shah, S. A., “Design and Tuning of Fixed Structure PID Controllers-A Survey,” Ph.D. Thesis, University of Glasgow, 1995.
8. Seo, J.-W., Kim, K.-H., Kim, S.-J., Oh, M., and Lee, T.-H., “Control of Atmospheric Distillation Unit Using Model Predictive Control Technique,” Korean Chemical Engineering Research, Vol. 40, No. 2, pp. 152-158, 2002.
9. Lee, T. G. and Kang, Y. S., “Development of Deep Artificial Neural Network Controller based on Non-linear Model Predictive Control Data for Real-Time Autonomous Driving,” Journal of Institute of Control, Robotics and Systems, Vol. 26, No. 5, pp. 302-311, 2020.
10. Li, Y., Wen, Y., Tao, D., and Guan, K., “Transforming Cooling Optimization for Green Data Center via Deep Reinforcement Learning,” IEEE Transactions on Cybernetics, Vol. 50, No. 5, pp. 2002-2013, 2019.
11. Yang, I.-H., “Development of an Artificial Neural Network Model to Predict the Optimal Pre-Cooling Time in Office Buildings,” Journal of Asian Architecture and Building Engineering, Vol. 9, No. 2, pp. 539-546, 2010.
12. Lim, H., Kang, Y., Kim, C., and Kim, J., “Experimental Verification of Nonlinear Model Predictive Tracking Control for Six-Wheeled Unmanned Ground Vehicles,” International Journal of Precision Engineering and Manufacturing, Vol. 15, No. 5, pp. 831-840, 2014.
13. Ma, Y., Borrelli, F., Hencey, B., Coffey, B., Bengea, S., et al., “Model Predictive Control for the Operation of Building Cooling Systems,” IEEE Transactions on Control Systems Technology, Vol. 20, No. 3, pp. 796-803, 2011.
14. Bellman, R., “Dynamic Programming,” Science, Vol. 153, No. 3731, pp. 34-37, 1966.
15. Ljung, L., “System Identification: Theory for the User,” Prentice Hall, 2nd Ed., 1999.
16. Testud, J., Richalet, J., Rault, A., and Papon, J., “Model Predictive Heuristic Control: Applications to Industrial Processes,” Automatica, Vol. 14, No. 5, pp. 413-428, 1978.
17. Bitmead, R. R., Gevers, M., and Wertz, V., “Adaptive Optimal Control the Thinking Man’s GPC,” Prentice Hall, 1990.
18. Bitmead, R. R., Gevers, M., and Wertz, V., “Adaptive Optimal Control the Thinking Man’s GPC,” Prentice Hall, 1990.
19. Ljung, L. and Söderström, T., “Theory and Practice of Recursive Identification,” MIT Press, 1983.
20. Bittanti, S. and Campi, M. C., “Adaptive Control of Linear Time Invariant Systems: The “Bet on the Best” Principle,” Communications in Information & Systems, Vol. 6, No. 4, pp. 299-320, 2006.
21. Abbasi-Yadkori, Y. and Szepesvári, C., “Regret Bounds for the Adaptive Control of Linear Quadratic Systems,” Proc. of the 24th Annual Conference on Learning Theory, pp. 1-26, 2011.
22. Lee, J. H. and Kim, K. S., “Optimal Design of Boom for Telescopic Boom Type Forklift Truck,” Journal of the Korean Society for Precision Engineering, Vol. 37, No. 6, pp. 457-464, 2020.
23. Myers, R. H., Montgomery, D. C., and Anderson-Cook, C. M., “Response Surface Methodology: Process and Product Optimization Using Designed Experiments,” John Wiley & Sons, 3rd Ed., 2009.
24. Box, G. E., Jenkins, G. M., Reinsel, G. C., and Ljung, G. M., “Time Series Analysis: Forecasting and Control,” John Wiley & Sons, 5th Ed., 2015.
25. Kelman, A. and Borrelli, F., “Bilinear Model Predictive Control of a HVAC System Using Sequential Quadratic Programming,” IFAC Proceedings Volumes, Vol. 44, No. 1, pp. 9869-9874, 2011.
26. Abbasi-Yadkori, Y. and Szepesvári, C., “Bayesian Optimal Control of Smoothly Parameterized Systems,” Proc. of the 31st Conference on Uncertainty in Artificial Intelligence, pp. 2-11, 2015.
27. Abeille, M. and Lazaric, A., “Thompson Sampling for Linear-Quadratic Control Problems,” Proc. of the 20th International Conference on Artificial Intelligence and Statistics, pp. 1246-1254, 2017.
28. Ouyang, Y., Gagrani, M., and Jain, R., “Control of Unknown Linear Systems with Thompson Sampling,” Proc. of the 55th Annual Allerton Conference on Communication, Control, and Computing, pp. 1198-1205, 2017.
29. Lazic, N., Boutilier, C., Lu, T., Wong, E., Roy, B., et al., “Data Center Cooling Using Model-Predictive Control,” Proc. of the 22nd Conference on Neural Information Processing Systems, pp. 3814-3823, 2018.
30. Ibrahimi, M., Javanmard, A., and Van Roy, B., “Efficient Reinforcement Learning for High Dimensional Linear Quadratic Systems,” Proc. of the Conference on Neural Information Processing Systems, pp. 2645-2653, 2012.
31. Gao, J., “Machine Learning Applications for Data Center Optimization,” https://storage.googleapis.com/pub-tools-public-publication-data/pdf/42542.pdf (Accessed 19 NOVEMBER 2021)
32. Evans, R. and Gao, J., “DeepMind AI Reduces Google Data Centre Cooling Bill by 40%,” https://deepmind.com/blog/article/deepmind-ai-reduces-google-data-centre-cooling-bill-40 (Accessed 19 NOVEMBER 2021)
33. Ma, Y., Kelman, A., Daly, A., and Borrelli, F., “Predictive Control for Energy Efficient Buildings with Thermal Storage: Modeling, Stimulation, and Experiments,” IEEE Control Systems Magazine, Vol. 32, No. 1, pp. 44-64, 2012.
34. ASHRAE, “Thermal guidelines for Data Processing Environments,” https://airatwork.com/wp-content/uploads/ASHRAETC99.pdf (Accessed 19 NOVEMBER 2021)
35. Hastie, T., Tibshirani, R., and Friedman, J., “The Elements of Statistical Learning: Data Mining, Inference, and Prediction,” Springer, 2nd Ed., 2009.
36. Samsung SDS, “Brightics Machine Learning,” https://www.samsungsds.com/kr/ai-ml/brightics-machine-learning.html (Accessed 19 NOVEMBER 2021)

Min Sik Chu

Principal Consultant in Data Analytics Group, Samsung SDS. His research interest is active learning, reinforcement learning.

E-mail: minsik.chu@samsung.com

Hyun Ah Kim

Senior Consultant in Data Analytics Group, Samsung SDS. Her research interest is anomaly detection, quality/process control, and manufacturing process optimizations.

E-mail: h0324.kim@samsung.com

Kyu Jong Lee

Senior Consultant in Data Analytics Group, Samsung SDS. His research interest is anomaly detection, quality/process control, and manufacturing process optimizations.

E-mail: kyujong.lee@samsung.com

Ji Hoon Kang

Assistant Professor, Korea Polytechnic University. His research interest is ML modeling and optimization algorithms in manufacturing processes.

E-mail: jhkang82@kpu.ac.kr