smartGeoinfoOriginalPython/batch_process.py

import settle_prediction_steps_main
import pandas as pd
import os

# 입력 파일이 있는 폴더명 지정: 사용자 직접 지정 필요
input_dir = 'data'

# 침하 예측 결과 파일을 저장할 폴더명 지정: 사용자 직접 지정 필요
output_dir = 'output'

# 에러 분석 결과 파일을 저장할 폴더명 지정: 사용자 직접 지정 필요
output_error = 'error'

# 침하 계측값의 단위 지정: 응동 m, 서컨 cm
settle_unit = 'cm'

# 입력 파일의 이름을 저장할 리스트 초기화
input_files = []

# 일단 및 다단 성토를 포함한 예측의 에러를 저장할 데이터프레임 초기화
df_overall = pd.DataFrame(columns=['File', 'Data_usage', 'RMSE_hyper_original', 'RMSE_hyper_nonlinear',
                                   'Final_error_hyper_original', 'Final_error_hyper_nonlinear'])

# 다단 성토만의 예측의 에러를 저장할 데이터프레임 초기화
df_multi_step = pd.DataFrame(columns=['File', 'Data_usage', 'RMSE_hyper_original', 'RMSE_hyper_nonlinear', 'RMSE_step',
                                      'Final_error_hyper_original', 'Final_error_hyper_nonlinear', 'Final_error_step'])

# 입력 파일 저장 폴더에서 입력 파일의 이름을 파악하여 배열에 저장
for (root, directories, files) in os.walk(input_dir):   # 입력 파일 안의 모든 파일에 대해서
    for file in files:                                  # 모든 파일 중 하나의 파일에 대해서
        file_path = os.path.join(root, file)            # 파일 경로를 포함한 파일명 설정
        input_files.append(file_path)                   # 파일명을 배열에 저장

# 입력 파일명 저장소의 파일 하나에 대해서 예측을 수행하고, 결과값으로 잔차값을 받아서 저장
for input_file in input_files:

    # 최종 성토 이후 데이터 사용 영역에 대해서 [20 30 40 50 60 70 80 90]
    for i in range(20, 100, 10):

        # 침하 예측을 수행하고 반환값 저장
        return_values = settle_prediction_steps_main.\
            run_settle_prediction(input_file=input_file, output_dir=output_dir,
                                  final_step_predict_percent=i,
                                  additional_predict_percent=100,
                                  plot_show=False,
                                  print_values=False,
                                  run_original_hyperbolic=True,
                                  run_nonlinear_hyperbolic=True,
                                  run_step_prediction=True,
                                  settle_unit=settle_unit)

        # 데이터프레임에 일단 및 다단 성토를 포함한 예측의 에러를 저장
        df_overall.loc[len(df_overall.index)] = [input_file, i, return_values[0], return_values[1],
                                                 return_values[3], return_values[4]]

        # 데이터프레임에 다단 성토만에 대한 예측의 에러를 저장
        if return_values[6]:
            df_multi_step.loc[len(df_multi_step.index)] = [input_file, i, return_values[0], return_values[1],
                                                           return_values[2], return_values[3],
                                                           return_values[4], return_values[5]]

# 에러 파일을 출력
df_overall.to_csv('error_overall.csv')
df_multi_step.to_csv('error_multi_step.csv')