J Plant Biotechnol 2016; 43(3): 383-390
Published online September 30, 2016
https://doi.org/10.5010/JPB.2016.43.3.383
© The Korean Society of Plant Biotechnology
안명숙, 임찬주, 송승엽, 민성란, 이인호, 노일섭, 김석원
한국생명공학연구원 생물자원센터,
아시아종묘㈜ 생명공학육종연구소,
농업진흥청국립 특작과학원 온난화대응농업연구소,
한국생명공학연구원 식물시스템공학연구센터,
순천대학교 생명산업과학대학 원예학과
Correspondence to : e-mail: kimsw@kribb.re.kr
This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
To determine whether FT-IR spectral analysis based on multivariate analysis could be used to discriminate Chinese cabbage breeding line at metabolic level, whole cell extracts of nine different breeding lines (three paternal, three maternal and three F1 lines) were subjected to Fourier transform infrared spectroscopy (FT-IR). FT-IR spectral data of Chinese cabbage plants were analyzed by principal component analysis (PCA), partial least square discriminant analysis (PLS-DA), and hierarchical clustering analysis (HCA). The hierarchical dendrograms based on PLS-DA from two of three cross combinations showed that paternal, maternal, and their progeny F1 lines samples were perfectly separated into three branches in breeding line dependent manner. However, a cross combination failed to fully discriminate them into three branches. Thus, hierarchical dendrograms based on PLS-DA of FT-IR spectral data of Chinese cabbage breeding lines could be used to represent the most probable chemotaxonomical relationship among maternal, paternal, and F1 plants. Furthermore, these metabolic discrimination systems could be applied for rapid selection and classification of useful Chinese cabbage cultivars.
Keywords Fourier transformation - infrared spectroscopy, Chinese cabbage, metabolic discrimination, Partial least square discriminant analysis (PLS-DA), Principal component analysis (PCA)
배추는 십자화과 배추속 식물로써 아시아 지역에서 중요한 작물로 재배되고 있다(Mampholo et al. 2013). 특히, 한국에서는 김치를 만들기 위한 주 원료로 사용되기 때문에 가장 중요한 채소로 재배가 이루어지고 있다(Kim et al. 2013). 또한, 배추에는 글루코시놀레이트, 카로티노이드 및 플라보노이드 등 페놀성 화합물을 포함한 다양한 기능성 성분들이 존재한다(Kim et al. 2004; Harbaum et al. 2007). 이러한 기능성 성분들은 항암, 항산화 효과 그리고 항염증 작용 등에 다양한 효과가 있다. 최근 고기능성 배추의 식별 및 품종 개발에 소비자들의 관심이 높아짐에 따라 교배 종에 대한 식별, 생산지에 대한 식별 등에 관한 정보 제공의 필요성이 높아지고 있다. 농산물 품종의 판별 분석 및 유전적 근연관계를 분석하기 위해서는 RFLP (restriction fragment length polymorphism), RAPD (random-amplified polymorphic DNA), SSR (simple sequence repeat, microsatellite), AFLP (amplified fragment length polymorphism) 등과 같은 분자생물학적 DNA marker를 이용한 식별 방법이 주로 이용되고 있다. 배추에서는 유용한 품종을 식별하는데 분자마커를 이용하기 위하여 유전자 family를 발굴하고 있으며(Kim et al. 2013), GM (genetically modified crops)과 non-GM 배추를 식별하기 위하여 HPLC-MS와 HPLC-DAD를 활용한 바 있다(Kim et al. 2009). 그러나 이들 분석기술들은 시료 준비과정에서 많은 시간 및 비용이 소요되고 있어 보다 간편하고 신속한 식별 기술 개발이 요구되고 있다. 적색결구배추는 청경채와 배추의 장점을 동시에 가지고 있는 품종으로 최근 소비자들의 수요가 크게 증가되고 있어서 우수한 품종 육성을 위해 신속한 식별법의 개발이 요구 되고 있다.
대사체 지문분석기술(metabolite fingerprinting)은 대사체 정보로부터 시료간의 양적, 질적 패턴 차이를 규명할 수 있는 기술로 시료의 전세포 추출물로부터 얻어진 스펙트럼 데이터는 다변량 통계분석 기법(principal component analysis, discriminant analysis)을 이용하여 시료 식별에 활용할 수 있다. 대사체 연구는 주로 FT-IR (Fourier transform infrared spectroscopy), HNMR (proton nuclear magnetic resonance spectroscopy)및 MS (mass spectrometry)등의 장비가 이용되고 있다(Krishnan et al. 2005).
특히 FT-IR (Fourier transform infrared spectroscopy)과 FT- NIR (Fourier transform near-infrared spectroscopy)로부터 얻어진 스펙트럼 데이터의 다변량 통계분석 기술은 다수의 시료들로부터 신속하고 간편하게 조사할 수 있다. 최근 FT-IR과 다변량 통계분석 기법이 결합된 기술은 서로 다른 춘장에 대한 패턴 인식(Jiang et al. 2012), 시리안 햄스터 배아 세포 분류(Ahmadzai et al. 2012), 난초과 석곡속(
따라서 본 연구에서는 FT-IR 스펙트럼의 다변량 통계분석 기법을 이용하여 현재 신품종 육성을 위하여 선발된 배추의 계통별 시료를 대상으로 대사체 수준에서 부계, 모계, 자손으로 신속하게 구분할 수 있는 식별체계를 확립하고자 하였다. 더 나아가 본 기술을 활용하여 안토시아닌 계열 기능성 성분이 우수한 계통 선발을 가속화하여 신품종 개발은 물론 신속 품종식별 기술의 발판을 구축하고자 한다.
본 연구에 사용된 배추(
9계통 45점의 배추 시료로부터 분말 20 mg을 각각 취한 다음 1.5 ml Eppendorf tube에 넣고 20%(v/v) methanol 용액을 200 µL씩 첨가하여 잘 섞어주었다. 각 tube를 50°C water bath에서 20분간 반응시킨 다음 13,000 rpm에서 15분간 원심분리한 후 상징액을 새로운 tube에 옮겼다. 회수한 상징액은 다시13,000 rpm에서 5분간 원심분리한 뒤 찌꺼기가 들어가지 않도록 상징액을 조심스럽게 새로운 tube로 옮겼다. 추출된 추출물은 -20°C에서 보관하여 FT-IR 스펙트럼 분석에 사용하였다.
FT-IR 스펙트럼 조사는 Tensor 27 (Bruker Optics GmbH, Ettlingen, Germany)을 사용하였고, DTGS (deuterated triglycine sulfate) 검출기로 분석하였다. 추출된 각각의 시료를 5 µL씩 384- well silicon plate에 분주하여, 37°C hot plate에서 약 20분간 건조하였다. 건조된 silicon plate는 Tensor 27에 장착된 HTS-XT (Bruker Optics GmbH) 고효율 자동화 장치를 이용하여 스펙트럼을 측정하였다. 각 시료의 스펙트럼은 총 4,000 ~ 400 cm-1 범위에서 그리고 4 cm-1 간격으로 총 128회 반복 측정된 평균 스펙트럼을 분석에 사용되었다. 각 시료는 각각 3반복으로 FT-IR 스펙트럼을 반복 측정하였다. FT-IR 스펙트럼 조사 및 데이터 변환에 사용된 프로그램은 Bruker에서 제공하는 OPUS Lab (ver. 7.0, Bruker Optics Inc.)를 사용하였다. FT-IR 스펙트럼 데이터의 다변량 통계분석을 위해 먼저 FT-IR 스펙트럼 데이터의 baseline 교정, normalization 및 mean centering 등 스펙트럼의 전처리 과정을 R 프로그램 (version 2.15.2)을 이용하여 수행하였다. Baseline 교정을 위해 FT-IR 스펙트럼 분석 영역의 양 끝점(800-1,800 cm-1)의 흡광도를 0으로 조정하였으며 실험상의 오차를 최소화하기 위하여 각 스펙트럼을 동일 면적으로 normalization 하였다. 이후 데이터의 mean centering 과정을 거쳐 2차 미분한 다음 다변량 통계분석 분석을 위한 표준화된 데이터로 사용하였다.
가공된 FT-IR 스펙트럼 데이터는 NIPALS 알고리즘(Wold 1966)을 이용하여 R 프로그램(version 2.15.2)을 사용하여 PCA (Principal component analysis)와 PLS-DA (Partial least squares discrminant)분석을 수행하였다(Fiehn et al. 2000; Trygg et al. 2007). PCA 및 PLS-DA 분석을 통해 얻어진 score를 이용하여 HCA (hierarchical clustering analysis) 분석하였으며 유사도 지수로 UPGMA (unweighted pair group method with arithmetic mean analysis)를 사용한 euclidean distance를 측정하여 각 시료의 유연관계를 덴드로그램으로 나타냈다.
배추 시료로부터 얻어진 전세포 추출물의 FT-IR 스펙트럼 데이터를 이용한 다변량 통계분석을 통해 배추의 대사체 수준 유연관계 규명 및 식별체계를 확립하였다. 각 그룹의 부계, 모계 그리고 F1은 FT-IR 스펙트럼상의 1,500 ~ 1,700, 1,300 ~ 1,500, 950 ~ 1,100 cm-1 부위에서 대사체의 양적, 질적 패턴 변화가 크게 이루어짐을 알 수 있었다(Fig. 2A, 4A, 6A). FT-IR 스펙트럼의 1,500 ~ 1,700, 1,300 ~ 1,500 그리고 950 ~ 1,100 cm-1 부위는 각각 Amide I 과 II을 포함하는 아미노산 및 단백질계열의 화합물, phosphodiester group을 포함한 핵산 및 인지질 그리고 단당류나 복합 다당류를 포함하는 carbohydrates 계열의 화합물들의 질적, 양적 정보를 반영하는 부위이다(Parker 1983; Dumas and Miller 2003; Wolkers et al. 2004; Yee et al. 2004; D’Souza et al. 2008; Lopez-Sanchez et al. 2010). 즉 FT-IR 스펙트럼 상의 질적, 양적 차이는 각 계통간에 함유되어 있는 아미노산이나 단백질, 지방산, 그리고 탄수화물계통 화합물들의 질적, 양적 차이가 현저하게 나타남을 의미한다. 따라서 FT-IR 스펙트럼 분석은 각 그룹의 부계, 모계 그리고 F1에서 대사체의 질적, 양적 변화를 예측하고 계통의 신속한 선발 수단으로 활용이 가능할 것으로 기대된다.
Plant materials used for this study. Maternal (A), paternal (B), and F1 plant (C). Scale bars, 2 cm
Multivariate analysis of FT-IR spectral data from group A of
Hierarchical dendrogram of FT-IR data from group A of
Multivariate analysis of FT-IR spectral data from group B of
Hierarchical dendrogram of FT-IR data from group B of
Multivariate analysis of FT-IR spectral data from group C of
각 그룹의 부계, 모계 그리고 F1 시료간에 FT-IR 스펙트럼 데이터의 PCA를 각각 분석 결과, 그룹 A의 PC 1과 2 score는 각각 8.8%, 8.4%의 설명력을 갖고 있으며 전체 변이량의 약 17.2%를 반영하고 있음을 알 수 있었다(Fig. 2B). 부계(P)와 모계(M)는 대체로 상, 하로 나뉘는 경향을, F1(F)들은 부계와 중첩되면서 대사체 수준에서는 부계와 유연관계가 높음을 나타냈다. 그룹 B의 PC 1과 2 score는 각각 9.5%, 7.9%의 설명력을 갖고 있으며 전체 변이량의 약 17.4%를 반영하였다(Fig. 4B). 그룹 B에서는 부계(P), 모계(M) 그리고 F1(F)들이 서로 대사체 수준에서 유연관계가 높아 중첩되는 모습을 볼 수 있었다. 또한, 그룹 C의 PC 1과 2 score는 각각 10.8%, 7.7%의 설명력을 갖고 있으며 전체 변이량의 약 18.5%를 반영하였다(Fig. 6B). 그룹 C는 부계(P)안에 모계(M)가 중첩되었고, F1(F)이 부계와 모계에 중첩되었다. 이는 모계가 부계와 유연관계가 높고, F1이 이들 두 집단 모두와 유연관계를 갖는 것으로 볼 수 있다.
PCA score plot에서 각 그룹의 대사체 수준의 식별을 하는데 중요한 FT-IR 스펙트럼 부위를 조사하기 위하여 loading value를 조사였다(Fig. 2C, 4C, 6C). FT-IR loading value 분석 결과 각 계통을 식별하는데 가장 중요한 역할을 한 PC 1과 2의 스펙트럼 부위는 1,150–1,000 cm-1 부위임을 알 수 있었다(Fig. 2C, 4C, 6C). 이 부위는 FT-IR 스펙트럼상에서 차이를 보였던 부위(Fig. 2A, 4A, 6A)와 거의 일치하는 것으로 carbohydrates 계열의 화합물들의 질적, 양적 차이가 각 그룹간에 부계, 모계 그리고 F1의 대사체 수준 식별에 중요한 역할을 하고 있음을 알 수 있었다(Fig. 2C, 4C, 6C).
PLS-DA 분석의 경우 PCA 분석 보다 부계, 모계, F1간 식별이 뚜렷하게 나타났다(Fig. 2D, 4D, 6D). 각각의 그룹간에 PLS-DA score plot을 보면 부계, 모계 그리고 F1이 각각 별도의 그룹을 형성하였다. 그룹 A의 PLS-DA 분석결과를 보면 PCA score plot에서 관찰되었던 그룹간에 중첩되는 현상을 볼 수 없었고 각각의 그룹을 따로 형성하면서 계통 식별이 가능하였다. PLS-DA score plot상에 부계(P)는 상단에 위치 하였고, 모계(M)는 좌측 하단에 위치하였으며, F1(F)은 우측 하단에 위치하였다 (Fig. 2D). 또한, 그룹 B에서는 부계(P)는 좌측 하단에 위치 하였고, 모계(M)는 우측 하단에 위치하였으며, F1(F)은 부계(P)와 모계(M) 사이의 상단에 위치하였다. PCA에서 부계, 모계 그리고 F1은 유연관계가 높았지만, PLS-DA에서는 각각 그룹을 형성하면서 계통 식별이 가능하였다(Fig. 4D). 그리고 그룹 C에서도 마찬가지로 부계, 모계, F1이 각각의 그룹을 형성하면서 계통 식별을 가능하게 하였다(Fig. 6D). 이처럼, FT-IR 스펙트럼 데이터 이용한 PLS-DA 분석으로 부계, 모계, F1 간의 계통 구분이 가능함을 알 수 있었다.
HCA 덴드로그램 분석 결과를 보면 그룹 A에서 부계, 모계, F1이 대체로 각각의 그룹으로 구분되는 것을 볼 수 있었다(Fig. 3). 특히, F1은 PCA 덴드로그램과 PLS-DA 덴드로그램에서 모계보다 부계와 같이 그룹을 형성하는 것을 볼 수 있는데 이는 모계보다 부계와 대사체 수준에서 유연관계가 높음을 나타낸다. 그룹 B의 PCA 덴드로그램에서는 부계, 모계, F1 간의 유연관계가 높아 각각의 그룹을 형성하지 못하였다(Fig. 4A). 하지만 PLS-DA 덴드로그램에서는 3개의 계통으로 그룹을 형성하였고, F1이 부계와 유연관계가 높음을 알 수 있었다(Fig. 5B). 또한 그룹 C에서도 그룹 B의 분석 결과와 마찬가지로 PCA 덴드로그램에서는 부계, 모계, F1이 유연관계가 높아 각각의 그룹을 형성하지 못하였다(Fig. 7A). 하지만 PLS-DA 덴드로그램에서는 각 계통별로 3개의 그룹을 형성하였고, 모계와 부계의 유연관계가 F1과의 유연관계보다 높아 F1이 다른 그룹을 형성하였다(Fig. 5B). 이 결과에서 F1이 부모세대의 대사산물의 특징들과는 다른 대사체 특성을 가짐을 예측 할 수 있다. 이상의 연구 결과로 볼 때 FT-IR 스펙트럼 데이터 분석은 부계, 모계, F1의 계통에 따라 대사 산물의 질적, 양적 패턴 차이를 밝혀냈으며, 이들 스펙트럼 데이터의 다변량 통계분석을 통해 계통 식별 및 계통 간의 유연관계 분석을 가능하게 하였다.
Hierarchical dendrogram of FT-IR data from group C of
FT-IR을 이용한 대사체 수준의 종 식별 기술은 난초과 석곡속(
따라서 본 연구에서 확립된 대사체 수준에서의 배추 계통 식별 기술은 품종, 계통의 신속한 선발 수단으로 활용이 가능할 것으로 기대되며 교배 육종을 통한 품종개발 가속화에 기여 할 수 있을 것으로 예상된다. 아울러 본 기술은 다양한 작물의 교배 품종 육성에도 효과적인 수단으로 활용이 가능할 것으로 기대된다.
본 연구에서는 국내에서 재배중인 배추 전세포 추출물의 FT-IR 스펙트럼 데이터로부터 다변량 통계분석(PCA, PLS-DA, HCA)을 이용하여 신속하고 간편한 계통 구분체계를 확립하였다. 다변량 통계분석 결과 대사체 수준에서 배추의 부계, 모계, F1 계통들이 계통에 따라 유연관계가 높음을 알 수 있었다. 아울러 본 연구에서 얻어진 대사체 정보의 유연관계분석은 F1 계통의 부계와 모계에 대한 유연관계가 교배에 따라 달라질 수 있음을 보여주었다. 따라서 FT-IR 스펙트럼 데이터의 다변량 통계분석 기술은 대사체 정보를 기반으로 한 신품종 선발방법의 간편성과 신속성을 고려할 때 배추의 계통이나 품종의 신속한 식별 수단으로 활용이 가능할 것으로 기대된다.
본 연구는 농림수산식품부 농생명산업기술개발사업(111161-5) 및 한국한의학연구원의‘생명공학기술 기반 한약자원 생산 다양화 기술 개발’(K14418)의 재원으로 수행된 연구입니다.
J Plant Biotechnol 2016; 43(3): 383-390
Published online September 30, 2016 https://doi.org/10.5010/JPB.2016.43.3.383
Copyright © The Korean Society of Plant Biotechnology.
안명숙, 임찬주, 송승엽, 민성란, 이인호, 노일섭, 김석원
한국생명공학연구원 생물자원센터,
아시아종묘㈜ 생명공학육종연구소,
농업진흥청국립 특작과학원 온난화대응농업연구소,
한국생명공학연구원 식물시스템공학연구센터,
순천대학교 생명산업과학대학 원예학과
Myung Suk Ahn, Chan Ju Lim, Seung Yeob Song, Sung Ran Min, In Ho Lee, Ill-Sup Nou, and Suk Weon Kim
Biological Resources Center, Korea Research Institute of Bioscience and Biotechnology (KRIBB), 181, Ipsin-gil, Jeongeup-si, Jeollabuk-do, 56212, Korea,
Asia Seed Co. Research Institute of Biotechnology Breeding, 518 Beon-gi, Gyeongchung-daero, Janghowon-eup, Icheon-si, Gyeonggi-do, 17414, Korea,
Research Institute of Climate Change and Agriculture, National Institute of Horticultural and Herbal Science, Rural Development Administration (RDA), 281 Ayeon-ro, Jeju 63240, Korea,
Plant Systems Engineering Research Center, Korea Research Institute of Bioscience and Biotechnology (KRIBB), 125, Gwahak-ro, Yuseong-gu, Daejeon 34141, Korea,
Department of Horticulture, Sunchon National University, 255, Jungang-ro, Suncheon-si, Jeollanam-do, 57922, Korea
Correspondence to: e-mail: kimsw@kribb.re.kr
This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
To determine whether FT-IR spectral analysis based on multivariate analysis could be used to discriminate Chinese cabbage breeding line at metabolic level, whole cell extracts of nine different breeding lines (three paternal, three maternal and three F1 lines) were subjected to Fourier transform infrared spectroscopy (FT-IR). FT-IR spectral data of Chinese cabbage plants were analyzed by principal component analysis (PCA), partial least square discriminant analysis (PLS-DA), and hierarchical clustering analysis (HCA). The hierarchical dendrograms based on PLS-DA from two of three cross combinations showed that paternal, maternal, and their progeny F1 lines samples were perfectly separated into three branches in breeding line dependent manner. However, a cross combination failed to fully discriminate them into three branches. Thus, hierarchical dendrograms based on PLS-DA of FT-IR spectral data of Chinese cabbage breeding lines could be used to represent the most probable chemotaxonomical relationship among maternal, paternal, and F1 plants. Furthermore, these metabolic discrimination systems could be applied for rapid selection and classification of useful Chinese cabbage cultivars.
Keywords: Fourier transformation - infrared spectroscopy, Chinese cabbage, metabolic discrimination, Partial least square discriminant analysis (PLS-DA), Principal component analysis (PCA)
배추는 십자화과 배추속 식물로써 아시아 지역에서 중요한 작물로 재배되고 있다(Mampholo et al. 2013). 특히, 한국에서는 김치를 만들기 위한 주 원료로 사용되기 때문에 가장 중요한 채소로 재배가 이루어지고 있다(Kim et al. 2013). 또한, 배추에는 글루코시놀레이트, 카로티노이드 및 플라보노이드 등 페놀성 화합물을 포함한 다양한 기능성 성분들이 존재한다(Kim et al. 2004; Harbaum et al. 2007). 이러한 기능성 성분들은 항암, 항산화 효과 그리고 항염증 작용 등에 다양한 효과가 있다. 최근 고기능성 배추의 식별 및 품종 개발에 소비자들의 관심이 높아짐에 따라 교배 종에 대한 식별, 생산지에 대한 식별 등에 관한 정보 제공의 필요성이 높아지고 있다. 농산물 품종의 판별 분석 및 유전적 근연관계를 분석하기 위해서는 RFLP (restriction fragment length polymorphism), RAPD (random-amplified polymorphic DNA), SSR (simple sequence repeat, microsatellite), AFLP (amplified fragment length polymorphism) 등과 같은 분자생물학적 DNA marker를 이용한 식별 방법이 주로 이용되고 있다. 배추에서는 유용한 품종을 식별하는데 분자마커를 이용하기 위하여 유전자 family를 발굴하고 있으며(Kim et al. 2013), GM (genetically modified crops)과 non-GM 배추를 식별하기 위하여 HPLC-MS와 HPLC-DAD를 활용한 바 있다(Kim et al. 2009). 그러나 이들 분석기술들은 시료 준비과정에서 많은 시간 및 비용이 소요되고 있어 보다 간편하고 신속한 식별 기술 개발이 요구되고 있다. 적색결구배추는 청경채와 배추의 장점을 동시에 가지고 있는 품종으로 최근 소비자들의 수요가 크게 증가되고 있어서 우수한 품종 육성을 위해 신속한 식별법의 개발이 요구 되고 있다.
대사체 지문분석기술(metabolite fingerprinting)은 대사체 정보로부터 시료간의 양적, 질적 패턴 차이를 규명할 수 있는 기술로 시료의 전세포 추출물로부터 얻어진 스펙트럼 데이터는 다변량 통계분석 기법(principal component analysis, discriminant analysis)을 이용하여 시료 식별에 활용할 수 있다. 대사체 연구는 주로 FT-IR (Fourier transform infrared spectroscopy), HNMR (proton nuclear magnetic resonance spectroscopy)및 MS (mass spectrometry)등의 장비가 이용되고 있다(Krishnan et al. 2005).
특히 FT-IR (Fourier transform infrared spectroscopy)과 FT- NIR (Fourier transform near-infrared spectroscopy)로부터 얻어진 스펙트럼 데이터의 다변량 통계분석 기술은 다수의 시료들로부터 신속하고 간편하게 조사할 수 있다. 최근 FT-IR과 다변량 통계분석 기법이 결합된 기술은 서로 다른 춘장에 대한 패턴 인식(Jiang et al. 2012), 시리안 햄스터 배아 세포 분류(Ahmadzai et al. 2012), 난초과 석곡속(
따라서 본 연구에서는 FT-IR 스펙트럼의 다변량 통계분석 기법을 이용하여 현재 신품종 육성을 위하여 선발된 배추의 계통별 시료를 대상으로 대사체 수준에서 부계, 모계, 자손으로 신속하게 구분할 수 있는 식별체계를 확립하고자 하였다. 더 나아가 본 기술을 활용하여 안토시아닌 계열 기능성 성분이 우수한 계통 선발을 가속화하여 신품종 개발은 물론 신속 품종식별 기술의 발판을 구축하고자 한다.
본 연구에 사용된 배추(
9계통 45점의 배추 시료로부터 분말 20 mg을 각각 취한 다음 1.5 ml Eppendorf tube에 넣고 20%(v/v) methanol 용액을 200 µL씩 첨가하여 잘 섞어주었다. 각 tube를 50°C water bath에서 20분간 반응시킨 다음 13,000 rpm에서 15분간 원심분리한 후 상징액을 새로운 tube에 옮겼다. 회수한 상징액은 다시13,000 rpm에서 5분간 원심분리한 뒤 찌꺼기가 들어가지 않도록 상징액을 조심스럽게 새로운 tube로 옮겼다. 추출된 추출물은 -20°C에서 보관하여 FT-IR 스펙트럼 분석에 사용하였다.
FT-IR 스펙트럼 조사는 Tensor 27 (Bruker Optics GmbH, Ettlingen, Germany)을 사용하였고, DTGS (deuterated triglycine sulfate) 검출기로 분석하였다. 추출된 각각의 시료를 5 µL씩 384- well silicon plate에 분주하여, 37°C hot plate에서 약 20분간 건조하였다. 건조된 silicon plate는 Tensor 27에 장착된 HTS-XT (Bruker Optics GmbH) 고효율 자동화 장치를 이용하여 스펙트럼을 측정하였다. 각 시료의 스펙트럼은 총 4,000 ~ 400 cm-1 범위에서 그리고 4 cm-1 간격으로 총 128회 반복 측정된 평균 스펙트럼을 분석에 사용되었다. 각 시료는 각각 3반복으로 FT-IR 스펙트럼을 반복 측정하였다. FT-IR 스펙트럼 조사 및 데이터 변환에 사용된 프로그램은 Bruker에서 제공하는 OPUS Lab (ver. 7.0, Bruker Optics Inc.)를 사용하였다. FT-IR 스펙트럼 데이터의 다변량 통계분석을 위해 먼저 FT-IR 스펙트럼 데이터의 baseline 교정, normalization 및 mean centering 등 스펙트럼의 전처리 과정을 R 프로그램 (version 2.15.2)을 이용하여 수행하였다. Baseline 교정을 위해 FT-IR 스펙트럼 분석 영역의 양 끝점(800-1,800 cm-1)의 흡광도를 0으로 조정하였으며 실험상의 오차를 최소화하기 위하여 각 스펙트럼을 동일 면적으로 normalization 하였다. 이후 데이터의 mean centering 과정을 거쳐 2차 미분한 다음 다변량 통계분석 분석을 위한 표준화된 데이터로 사용하였다.
가공된 FT-IR 스펙트럼 데이터는 NIPALS 알고리즘(Wold 1966)을 이용하여 R 프로그램(version 2.15.2)을 사용하여 PCA (Principal component analysis)와 PLS-DA (Partial least squares discrminant)분석을 수행하였다(Fiehn et al. 2000; Trygg et al. 2007). PCA 및 PLS-DA 분석을 통해 얻어진 score를 이용하여 HCA (hierarchical clustering analysis) 분석하였으며 유사도 지수로 UPGMA (unweighted pair group method with arithmetic mean analysis)를 사용한 euclidean distance를 측정하여 각 시료의 유연관계를 덴드로그램으로 나타냈다.
배추 시료로부터 얻어진 전세포 추출물의 FT-IR 스펙트럼 데이터를 이용한 다변량 통계분석을 통해 배추의 대사체 수준 유연관계 규명 및 식별체계를 확립하였다. 각 그룹의 부계, 모계 그리고 F1은 FT-IR 스펙트럼상의 1,500 ~ 1,700, 1,300 ~ 1,500, 950 ~ 1,100 cm-1 부위에서 대사체의 양적, 질적 패턴 변화가 크게 이루어짐을 알 수 있었다(Fig. 2A, 4A, 6A). FT-IR 스펙트럼의 1,500 ~ 1,700, 1,300 ~ 1,500 그리고 950 ~ 1,100 cm-1 부위는 각각 Amide I 과 II을 포함하는 아미노산 및 단백질계열의 화합물, phosphodiester group을 포함한 핵산 및 인지질 그리고 단당류나 복합 다당류를 포함하는 carbohydrates 계열의 화합물들의 질적, 양적 정보를 반영하는 부위이다(Parker 1983; Dumas and Miller 2003; Wolkers et al. 2004; Yee et al. 2004; D’Souza et al. 2008; Lopez-Sanchez et al. 2010). 즉 FT-IR 스펙트럼 상의 질적, 양적 차이는 각 계통간에 함유되어 있는 아미노산이나 단백질, 지방산, 그리고 탄수화물계통 화합물들의 질적, 양적 차이가 현저하게 나타남을 의미한다. 따라서 FT-IR 스펙트럼 분석은 각 그룹의 부계, 모계 그리고 F1에서 대사체의 질적, 양적 변화를 예측하고 계통의 신속한 선발 수단으로 활용이 가능할 것으로 기대된다.
Plant materials used for this study. Maternal (A), paternal (B), and F1 plant (C). Scale bars, 2 cm
Multivariate analysis of FT-IR spectral data from group A of
Hierarchical dendrogram of FT-IR data from group A of
Multivariate analysis of FT-IR spectral data from group B of
Hierarchical dendrogram of FT-IR data from group B of
Multivariate analysis of FT-IR spectral data from group C of
각 그룹의 부계, 모계 그리고 F1 시료간에 FT-IR 스펙트럼 데이터의 PCA를 각각 분석 결과, 그룹 A의 PC 1과 2 score는 각각 8.8%, 8.4%의 설명력을 갖고 있으며 전체 변이량의 약 17.2%를 반영하고 있음을 알 수 있었다(Fig. 2B). 부계(P)와 모계(M)는 대체로 상, 하로 나뉘는 경향을, F1(F)들은 부계와 중첩되면서 대사체 수준에서는 부계와 유연관계가 높음을 나타냈다. 그룹 B의 PC 1과 2 score는 각각 9.5%, 7.9%의 설명력을 갖고 있으며 전체 변이량의 약 17.4%를 반영하였다(Fig. 4B). 그룹 B에서는 부계(P), 모계(M) 그리고 F1(F)들이 서로 대사체 수준에서 유연관계가 높아 중첩되는 모습을 볼 수 있었다. 또한, 그룹 C의 PC 1과 2 score는 각각 10.8%, 7.7%의 설명력을 갖고 있으며 전체 변이량의 약 18.5%를 반영하였다(Fig. 6B). 그룹 C는 부계(P)안에 모계(M)가 중첩되었고, F1(F)이 부계와 모계에 중첩되었다. 이는 모계가 부계와 유연관계가 높고, F1이 이들 두 집단 모두와 유연관계를 갖는 것으로 볼 수 있다.
PCA score plot에서 각 그룹의 대사체 수준의 식별을 하는데 중요한 FT-IR 스펙트럼 부위를 조사하기 위하여 loading value를 조사였다(Fig. 2C, 4C, 6C). FT-IR loading value 분석 결과 각 계통을 식별하는데 가장 중요한 역할을 한 PC 1과 2의 스펙트럼 부위는 1,150–1,000 cm-1 부위임을 알 수 있었다(Fig. 2C, 4C, 6C). 이 부위는 FT-IR 스펙트럼상에서 차이를 보였던 부위(Fig. 2A, 4A, 6A)와 거의 일치하는 것으로 carbohydrates 계열의 화합물들의 질적, 양적 차이가 각 그룹간에 부계, 모계 그리고 F1의 대사체 수준 식별에 중요한 역할을 하고 있음을 알 수 있었다(Fig. 2C, 4C, 6C).
PLS-DA 분석의 경우 PCA 분석 보다 부계, 모계, F1간 식별이 뚜렷하게 나타났다(Fig. 2D, 4D, 6D). 각각의 그룹간에 PLS-DA score plot을 보면 부계, 모계 그리고 F1이 각각 별도의 그룹을 형성하였다. 그룹 A의 PLS-DA 분석결과를 보면 PCA score plot에서 관찰되었던 그룹간에 중첩되는 현상을 볼 수 없었고 각각의 그룹을 따로 형성하면서 계통 식별이 가능하였다. PLS-DA score plot상에 부계(P)는 상단에 위치 하였고, 모계(M)는 좌측 하단에 위치하였으며, F1(F)은 우측 하단에 위치하였다 (Fig. 2D). 또한, 그룹 B에서는 부계(P)는 좌측 하단에 위치 하였고, 모계(M)는 우측 하단에 위치하였으며, F1(F)은 부계(P)와 모계(M) 사이의 상단에 위치하였다. PCA에서 부계, 모계 그리고 F1은 유연관계가 높았지만, PLS-DA에서는 각각 그룹을 형성하면서 계통 식별이 가능하였다(Fig. 4D). 그리고 그룹 C에서도 마찬가지로 부계, 모계, F1이 각각의 그룹을 형성하면서 계통 식별을 가능하게 하였다(Fig. 6D). 이처럼, FT-IR 스펙트럼 데이터 이용한 PLS-DA 분석으로 부계, 모계, F1 간의 계통 구분이 가능함을 알 수 있었다.
HCA 덴드로그램 분석 결과를 보면 그룹 A에서 부계, 모계, F1이 대체로 각각의 그룹으로 구분되는 것을 볼 수 있었다(Fig. 3). 특히, F1은 PCA 덴드로그램과 PLS-DA 덴드로그램에서 모계보다 부계와 같이 그룹을 형성하는 것을 볼 수 있는데 이는 모계보다 부계와 대사체 수준에서 유연관계가 높음을 나타낸다. 그룹 B의 PCA 덴드로그램에서는 부계, 모계, F1 간의 유연관계가 높아 각각의 그룹을 형성하지 못하였다(Fig. 4A). 하지만 PLS-DA 덴드로그램에서는 3개의 계통으로 그룹을 형성하였고, F1이 부계와 유연관계가 높음을 알 수 있었다(Fig. 5B). 또한 그룹 C에서도 그룹 B의 분석 결과와 마찬가지로 PCA 덴드로그램에서는 부계, 모계, F1이 유연관계가 높아 각각의 그룹을 형성하지 못하였다(Fig. 7A). 하지만 PLS-DA 덴드로그램에서는 각 계통별로 3개의 그룹을 형성하였고, 모계와 부계의 유연관계가 F1과의 유연관계보다 높아 F1이 다른 그룹을 형성하였다(Fig. 5B). 이 결과에서 F1이 부모세대의 대사산물의 특징들과는 다른 대사체 특성을 가짐을 예측 할 수 있다. 이상의 연구 결과로 볼 때 FT-IR 스펙트럼 데이터 분석은 부계, 모계, F1의 계통에 따라 대사 산물의 질적, 양적 패턴 차이를 밝혀냈으며, 이들 스펙트럼 데이터의 다변량 통계분석을 통해 계통 식별 및 계통 간의 유연관계 분석을 가능하게 하였다.
Hierarchical dendrogram of FT-IR data from group C of
FT-IR을 이용한 대사체 수준의 종 식별 기술은 난초과 석곡속(
따라서 본 연구에서 확립된 대사체 수준에서의 배추 계통 식별 기술은 품종, 계통의 신속한 선발 수단으로 활용이 가능할 것으로 기대되며 교배 육종을 통한 품종개발 가속화에 기여 할 수 있을 것으로 예상된다. 아울러 본 기술은 다양한 작물의 교배 품종 육성에도 효과적인 수단으로 활용이 가능할 것으로 기대된다.
본 연구에서는 국내에서 재배중인 배추 전세포 추출물의 FT-IR 스펙트럼 데이터로부터 다변량 통계분석(PCA, PLS-DA, HCA)을 이용하여 신속하고 간편한 계통 구분체계를 확립하였다. 다변량 통계분석 결과 대사체 수준에서 배추의 부계, 모계, F1 계통들이 계통에 따라 유연관계가 높음을 알 수 있었다. 아울러 본 연구에서 얻어진 대사체 정보의 유연관계분석은 F1 계통의 부계와 모계에 대한 유연관계가 교배에 따라 달라질 수 있음을 보여주었다. 따라서 FT-IR 스펙트럼 데이터의 다변량 통계분석 기술은 대사체 정보를 기반으로 한 신품종 선발방법의 간편성과 신속성을 고려할 때 배추의 계통이나 품종의 신속한 식별 수단으로 활용이 가능할 것으로 기대된다.
본 연구는 농림수산식품부 농생명산업기술개발사업(111161-5) 및 한국한의학연구원의‘생명공학기술 기반 한약자원 생산 다양화 기술 개발’(K14418)의 재원으로 수행된 연구입니다.
Plant materials used for this study. Maternal (A), paternal (B), and F1 plant (C). Scale bars, 2 cm
Multivariate analysis of FT-IR spectral data from group A of
Hierarchical dendrogram of FT-IR data from group A of
Multivariate analysis of FT-IR spectral data from group B of
Hierarchical dendrogram of FT-IR data from group B of
Multivariate analysis of FT-IR spectral data from group C of
Hierarchical dendrogram of FT-IR data from group C of
Myung Suk Ahn, Eun Jin So, Eun Yee Jie, So Yeon Choi, Sang Un Park, Byeong Cheol Moon, Young Min Kang, Sung Ran Min, and Suk Weon Kim
J Plant Biotechnol 2018; 45(3): 250-256Dae-Hwa Yang, Myung Suk Ahn, Ok-Cheol Jeong, In-Ja Song, Suk-Min Ko, Ye-In Jeon, Hong-Gyu Kang, Hyeon-Jin Sun, Yong-Ik Kwon, Suk Weon Kim, and Hyo-Yeon Lee
J Plant Biotechnol 2016; 43(2): 213-222Myung Suk Ahn, Sung Ran Min, Eun Yee Jie, Eun Jin So, So Yeon Choi, Byeong Cheol Moon, Young Min Kang, So-Young Park, and Suk Weon Kim
Journal of Plant Biotechnology 2015; 42(3): 257-264
Journal of
Plant BiotechnologyPlant materials used for this study. Maternal (A), paternal (B), and F1 plant (C). Scale bars, 2 cm
|@|~(^,^)~|@|Multivariate analysis of FT-IR spectral data from group A of
Hierarchical dendrogram of FT-IR data from group A of
Multivariate analysis of FT-IR spectral data from group B of
Hierarchical dendrogram of FT-IR data from group B of
Multivariate analysis of FT-IR spectral data from group C of
Hierarchical dendrogram of FT-IR data from group C of