قابلیت پیش بینی مدل‌های آماری در ارزیابی توان تولید رویشگاه راش شرقی

نوع مقاله: پژوهشی

نویسندگان

1 فارغ التحصیل کارشناسی ارشد دانشگاه تربیت مدرس

2 استادیار گروه جنگلداری، دانشکده منابع طبیعی و علوم دریایی، دانشگاه تربیت مدرس

3 استاد گروه جنگلداری، دانشکده منابع طبیعی و علوم دریایی، دانشگاه تربیت مدرس، نور، ایران

چکیده

در مطالعه حاضر قابلیت پیش بینی مدل‌های خطی و جمعی تعمیم یافته برای ارتفاع غالب گونه راش به عنوان شاخصی عالی از کیفیت رویشگاه مورد بررسی قرار گرفته است. ارتفاع غالب در مطالعه حاضر به صورت میانگین ارتفاع سه اصله از مرتفع ترین درخت در هر قطعه نمونه تعریف می‌شود. به این منظور، در تیپ‌هایی که در آنها گونة راش غالب بود، 127 قطعة نمونه دایره‌ای به مساحت 1000 مترمربع پیاده و در هر یک از آنها ارتفاع و قطر تمام درختان گونة راش قطورتر از 5/7 سانتی‌‌متر علاوه بر ارتفاع از سطح دریا و درصد شیب و آزیموت اندازه‌گیری و ثبت شد. همچنین در مرکز هر قطعة نمونه، از عمق 10-0 سانتی‌متری، نمونه‌برداری خاک صورت گرفت و متغیرهای فیزیکی و شیمیایی متعددی اندازه‌گیری شد. در تحقیق حاضر، عملکرد پنج روش گزینش متغیر به‌طور جداگانه برای هریک از مدل‌های خطی و جمعی تعمیم‌یافته مورد بررسی قرار گرفته است. به منظور مقایسه کارآیی روش‌های گزینش متغیر در مدل خطی تعمیم‌یافته، از اعتبارسنجی متقابل با 2500 تکرار و در مدل جمعی تعمیم‌یافته از اعتبارسنجی fold-10 استفاده شده است. پس از انتخاب بهترین روش گزینش متغیر در هریک از دو مدل خطی و جمعی تعمیم‌یافته‌، اهمیت نسبی هر یک از متغیرهای مهم را محاسبه نموده که درنهایت متغیر ارتفاع از سطح دریا به‌عنوان مهمترین متغیر اثرگذار بر ارتفاع غالب گونه راش شناسایی شد. سپس با استفاده از معیارهای ارزیابی حاصل از داده‌های مدل‌سازی مشاهده گردید مدل جمعی تعمیم‌یافته از نظر معیارهای ارزیابی، عملکرد بهتری نسبت به مدل خطی تعمیم-یافته دارد.

کلیدواژه‌ها

موضوعات


قابلیت پیش­بینی مدل­های آماری در ارزیابی توان تولید رویشگاه راش شرقی

سمیه دهقانی نژاد[1] ، سید جلیل علوی[2] ، سید محسن حسینی[3]

تاریخ دریافت: 25/4/96   تاریخ پذیرش: 19/6/97

 

چکیده

در مطالعه حاضر قابلیت پیش بینی مدل­های خطی و جمعی تعمیم یافته برای ارتفاع غالب گونه راش به عنوان شاخصی عالی از کیفیت رویشگاه مورد بررسی قرار گرفته است. ارتفاع غالب در مطالعه حاضر به صورت میانگین ارتفاع سه اصله از مرتفع ترین درخت در هر قطعه نمونه تعریف می­شود. به این منظور، در تیپ‌هایی که در آنها گونة راش غالب بود، 127 قطعة نمونه دایره‌ای به مساحت 1000 مترمربع پیاده و در هر یک از آنها ارتفاع و قطر تمام درختان گونة راش قطورتر از 5/7 سانتی‌‌متر علاوه بر ارتفاع از سطح دریا و درصد شیب و آزیموت اندازه‌گیری و ثبت شد. همچنین در مرکز هر قطعة نمونه، از عمق 10-0 سانتی‌متری، نمونه‌برداری خاک صورت گرفت و متغیرهای فیزیکی و شیمیایی متعددی اندازه‌گیری شد. در تحقیق حاضر، عملکرد پنج روش گزینش متغیر به­طور جداگانه برای هریک از مدل­های خطی و جمعی تعمیم­یافته مورد بررسی قرار گرفته است. به منظور مقایسه کارآیی روش­های گزینش متغیر در مدل خطی تعمیم­یافته، از اعتبارسنجی متقابل با 2500 تکرار و در مدل جمعی تعمیم­یافته از اعتبارسنجی fold-10 استفاده شده است. پس از انتخاب بهترین روش گزینش متغیر در هریک از دو مدل خطی و جمعی تعمیم­یافته­، اهمیت نسبی هر یک از متغیرهای مهم را محاسبه نموده که درنهایت متغیر ارتفاع از سطح دریا به­عنوان مهمترین متغیر اثرگذار بر ارتفاع غالب گونه راش شناسایی شد. سپس با استفاده از معیارهای ارزیابی حاصل از داده­های مدل­سازی مشاهده گردید مدل جمعی تعمیم­یافته از نظر معیارهای ارزیابی، عملکرد بهتری نسبت به مدل خطی تعمیم­یافته دارد.

 

واژه­های کلیدی: توان تولید رویشگاه، عملکرد گونه­، اعتبارسنجی، ضریب تبیین، مجذور میانگین مربعات خطا، مدل خطی تعمیم یافته، مدل جمعی تعمیم یافته.

 

 

 


مقدمه

مدل­سازی متغیر پاسخ با استفاده از متغیرهای تبیینی متعدد یکی از زمینه­های مطرح در اکولوژی پوشش گیاهی است. این مدل­ها برای اهداف مختلفی همانند پیش­بینی پاسخ­ها برای مشاهدات جدید (19)، برآورد خطر (8)، ایجاد فرضیه در مورد روابط علت و معلولی (16) و ساخت مدل­های همبستگی مکانی یا زمانی مقادیر پاسخ (13،17) بکار گرفته می­شوند.

درسال­های اخیر روش­های مدل­سازی متعددی با استفاده از متغیرهای محیطی برای پیش­بینی عملکرد گونه­های گیاهی توسعه یافته و با موفقیت­های مختلفی روبرو شده است که از آن جمله می­توان به مدل خطی تعمیم‌یافته[4]، مدل جمعی تعمیم‌یافته[5] و همچنین تکنیک­های مختلف داده­کاوی[6] همانند درخت طبقه­بندی و رگرسیون[7]، شبکه­های عصبی[8] و درخت رگرسیون تقویت شده[9] اشاره داشت (3).

مدل­های خطی تعمیم‌یافته که بسط مدل رگرسیون عام می‌باشد، برای مواقعی که مشاهدات به طور نرمال توزیع نیافته‌اند یا جایی که سایر جنبه‌های مدل رگرسیون عام مناسب نمی­باشد، ابداع شد. این مدل­ها که در سال 1972 توسط Nelder و Wedderburn معرفی شده است به طور موفقیت‌آمیز در پژوهش‌های اکولوژیک مورد استفاده قرار گرفته است (40).

استفاده از مدل خطی تعمیم‌یافته در اکولوژی پوشش گیاهی در مقایسه با رویکرد مدل‌سازی جمعی تعمیم‌یافته دارای نقاط ضعفی است که مهمترین آن این است که در مدل‌سازی رابطه عملکرد گونه و محیط، شکل منحنی پاسخ ممکن است از نظر زیستی، غیر واقع بینانه باشد (11)، علاوه بر این مدل­های خطی تعمیم‌یافته نیاز به پیش­فرض روابط تابعی بین متغیر پاسخ و متغیرهای پیشگو دارند.

انتخاب نادرست فرض تابعی بودن شکل رابطه، روابط صحیح را می­پوشاند و برآوردهای اریب­دار ارائه می‌دهد و باعث اشتباه در نتیجه­گیری می‌شود. برای رفع این مسئله، مدل­های جمعی تعمیم­یافته، به عنوان یکی از روش­های آماری مهم در چهل سال گذشته توسعه پیدا کرده است. این مدل، یک مدل ناپارامتری بوده و بسط مدل­های خطی تعمیم‌یافته (که خود نیز بسط مدل­های خطی عام می‌باشند) است. مدل جمعی تعمیم­یافته روش بسیار مناسبی را برای تجزیه و تحلیل داده­ها و بررسی رابطه بین متغیرهای وابسته و مستقل ارائه می‌دهد. مدل‌های جمعی تعمیم‌یافته (GAM) نسبت به مدل‌های خطی تعمیم‌یافته (GLM) از چند نظر برتری دارند و هدف از کاربرد این مدل­ها به حداکثر رساندن کیفیت پیش‌بینی متغیر وابسته، کشف روابط غیرخطی بین متغیر وابسته و مجموعه متغیرهای تبیینی است (10،9). از آن­جایی که مدل جمعی تعمیم‌یافته داده محور می‌باشد، سعی می‌نماید رابطه واقعی بین متغیر پاسخ و متغیرهای پیشگو را آشکارسازی نماید.

انتخاب متغیر و برآورد ضرایب در مدل رگرسیونی اساسی­ترین بخش در مدل­سازی است. از دیدگاه عملی، انتخاب متغیر به تعیین این که کدام متغیر بیشترین تأثیر را بر روی متغیر وابسته دارد، معطوف می­شود، در صورتی که از دیدگاه آماری روشی را برای دست یافتن به یک توازن بین نکویی برازش و اصل صرفه­جویی ارائه می­نماید. به عبارتی، با شناسایی موثر زیر مجموعه­ای از متغیرهای مهم، انتخاب متغیر می­تواند هم تفسیرپذیری مدل را تسهیل نماید و هم صحت پیش­بینی را بهبود بخشد.

معیارهای بسیاری برای مقایسه آماری مدل­های چند متغیره وجود دارد. اخیرا، معیارهای تئوری اطلاعات نظیر معیار اطلاعات آکائیک (AIC) و معیار اطلاعات بیزی شوارتز (BIC) مورد توجه اکولوژیست­ها قرار گرفته است (4، 12، 38). به عنوان مثال Mazerolle (2006) اشاره می­نماید که آماره  AICدر انتخاب مدل (مثلا انتخاب متغیر) نسبت به رویکردهای آزمون فرضیه به طور قابل توجهی ارجحیت دارد (21) و Lukacs و همکاران 2007 بیان می­دارند که تحلیل تبیینی داده­ها براساس روش­های آزمون فرضیه صفر همانند انتخاب گام به گام، اندیشه و استدلال را از تحلیل داده حذف می­نماید (20).

قدیمی­ترین الگوریتم برای انتخاب متغیرهای تبیینی مراحل گام به گام هستند، که در آن متغیرهای پیشگو داوطلب برای وارد شدن به مدل غربال می­گردند و متغیرهایی که از قبل در مدل هستند برای حذف­های بعدی مورد بررسی قرار می گیرند. الگوریتم­های مدرن­تر شامل جستجوی کامل زیر مجموعه­های بیشتری از متغیرهای پیشگو نسبت به رویکرد گام به گام می باشد که همین امر موجب تردید اکولوژیست­ها در سودمندی روش انتخاب گام به گام متغیر گردیده است.  Whittinghamو همکاران (2006)، به عنوان مثال، نسبت به استفاده گسترده از رویکردهای گام به گام در مجلات بوم­شناختی، با توجه به اریب­ها و نواقص مسلم رگرسیون گام به گام چندگانه، اظهار تأسف نموده است (39). Mundry & Nunn (2009) نیز همانند دیگران توصیه می­نمایند زیست­شناسان در به کارگیری این روش­ها اجتناب می­نمایند (25).

محققین بسیاری روش­های انتخاب متغیر را مورد بررسی و ارزیابی قرار دادند (28، 32، 38، 17). Raffalovich و همکاران (2008) مرور جامعی در این زمینه انجام دادند (29). شبیه­سازی تنها روشی است که در آن مدل واقعی شناخته می­شود، اما نتایج مطالعات شبیه­سازی به روش ایجاد  داده­های شبیه­سازی و معیارهای انتخاب شده جهت مقایسه تکنیک­های مختلف مدل­سازی، وابسته است. بعنوان مثال Murtaugh (1998) دریافت که رویکردهای متکی بر آزمون F و Cp و BIC فراوانی یکسانی از تصمیمات درست در خصوص ورود یا حذف متغیرهای تبیینی ارائه می­دهد (26). رویکردهای مبتنی بر درخت رگرسیون، نسبت به روش­های رگرسیونی، به طور قابل توجهی عملکرد ضعیفی دارند. اما Murtaugh (1998) با توجه به اینکه داده­ها براساس یک مدل رگرسیون خطی شبیه­سازی شده بودند، اعتبار مقایسه را مورد سوال قرار داد (26).

از دیدگاه جنگلداری، توان تولید، پتانسیل رویشگاه را برای تولید چوب برای یک گونه مشخص بازگو می­کند (36)؛ از این‏رو یکی از وظایف خطیر مدیران جنگل کمی‏سازی و سنجش اختلافات و تفاوت‌ها در رویشگاه‌ها است (37). از آن جایی که رویشگاه در تعیین میزان رشد (که یک فاکتور بسیار مهم و کلیدی در برنامه‏های مدیریت جنگل می‌باشد) نقش بسیار مهم ایفا می‌نماید، کیفیت آن نیز میزان رشد و توان تولید را تحت تأثیر قرار می‌دهد (22). یکی از معیارهای مهمی که تحت تأثیر کیفیت رویشگاه می­باشند، ارتفاع غالب بوده که به صورت ارتفاع 100 اصله از قطور‏ترین درختان در هکتار بیان می­شود(2). این معیار برخلاف قطر برابر سینه، کم‏تر تحت تأثیر عملیات پرورشی در جنگل قرار می­گیرد و رابطه نزدیکی با حجم درختان دارد، به همین دلیل معیار مناسبی برای بررسی کیفیت رویشگاه می­باشد (26).

در تحقیق حاضر، عملکرد پنج روش گزینش متغیر به­طور جداگانه برای هریک از مدل­های خطی و جمعی تعمیم­یافته مورد بررسی قرار گرفته است. از آنجایی که مدل صحیح شناخته شده­ای از متغیر پاسخ برحسب متغیرهای تبیینی وجود ندارد، اعتبارسنجی متقابل برای به دست آوردن برآورد درست از توانایی پیش­بینی استفاده می­گردد که می­تواند مقایسه منصفانه­ای از روش­های انتخاب متغیر باشد.

 

 

مواد و روش­ها

منطقه مورد بررسی

پژوهش حاضر در جنگل آموزشی و پژوهشی صلاح‌الدین کلا متعلق به دانشکده منابع طبیعی دانشگاه تربیت مدرس صورت گرفته است. منطقه مورد بررسی در سری 3 آغوزچال از طرح جنگلداری حوزه 46 کجور واقع شده است. این سری در قسمت شمال شرقی طرح کجور و درحوزه استحفاظی اداره کل منابع طبیعی و آبخیزداری استان مازندران- نوشهر، اداره منابع طبیعی و آبخیزداری شهرستان نوشهر و منابع طبیعی توسکاتک قرار دارد. مساحت منطقه 1817 هکتار و ارتفاع از سطح دریا از 150 تا 1750 متر می­باشد. منطقه مورد مطالعه بین عرض جغرافیایی "23'29º36 تا "56'32º36 و طول جغرافیایی "20'43º51 تا "39'47º51 قرار گرفته است. میزان بارندگی در این ناحیه بر اساس داده­های ایستگاه هواشناسی نوشهر 1308 میلی متر در سال می­باشد. گرم‌ترین ماه سال تیر و مرداد با میانگین دمای 2/29 و سردترین ماه سال، بهمن‌ماه با میانگین دمای 6/2 است. همچنین میانگین دمای سالانه برابر با 9/15 ثبت شده است. تیپ جنگل در منطقه مورد مطالعه آمیخته­ای از راش به همراه گونه ممرز، انجیلی، افرا، شیردار، نمدار، ون و بلوط می­باشد. جنگل دارای کلاسه سنی میانسال، مسن و جوان بوده و دارای تاج پوشش حدود 70 تا 85 % و 2 تا 3 اشکوبه می­باشند. جنگل دارای تراکم انبوه تا نیمه انبوه با ساختار دانه زاد ناهمسال نامنظم است. به طور میانگین گونه راش حدود 50 درصد از کل حجم سرپا و حدود 40 درصد از کل تعداد درختان را در منطقه مورد مطالعه به خود اختصاص داده است. در سری 3 آغوزچال هیچ واحد دامداری در داخل جنگل وجود ندارد و در حال حاضر تنها ، دامداران جهت ییلاق قشلاق از جنگل عبور می­نمایند. روستائیان منطقه نیز از جنگل استفاده تفریحی و توریستی می­نمایند (7).

 

روش بررسی

به منظور جمع­آوری اطلاعات مورد نیاز از 127 قطعات نمونه دایره­ای شکل با مساحت 1000 مترمربع در توده­هایی که در آن­ها گونه راش غالب بوده است استفاده شد. پس از پیاده نمودن قطعات نمونه، در داخل هر یک از آن­ها مشخصه‌های هر درخت از جمله نوع گونه، قطر برابر سینه و همچنین ارتفاع کامل تمام درختان راش با قطر بیشتر از 5/7 سانتی­متر مورد اندازه­گیری قرار گرفت. اندازه­گیری ارتفاع کامل درختان راش در هر قطعه نمونه با استفاده از دستگاه Vertex 3 انجام گرفت. ارتفاع غالب که در اینجا به صورت میانگین ارتفاع سه اصله از مرتفع­ترین درخت در هر قطعه نمونه تعریف می­شود، معمولاً به عنوان شاخصی عالی از کیفیت رویشگاه شناخته می­شود. ویژگی‌های عمومی رویشگاه مثل جهت جغرافیایی (آزیموت)، ارتفاع از سطح دریا و درصد شیب نیز یادداشت گردید. جهت جغرافیایی با استفاده از رابطه زیر به شاخص تابش خورشیدی[10] تبدیل گردید که در آن θ مقدار آزیموت جهت بر حسب درجه می­باشد. مقدار شاخص تابش خورشیدی بین صفر و یک می­باشد و جهت شمال شرقی دارای مقدار صفر (خنک‌ترین دامنه) و جهت جنوب غربی دارای مقدار یک (گرمترین دامنه) می­باشد (1).

                                                                                

در مرحله بعد در هر قطعه نمونه، نمونه‏برداری خاک از عمق 0 تا 10 سانتی­متر صورت گرفت. نمونه­ها خاک همچنین در مرکز هر قطعه نمونه، از لایه اول نمونه‌برداری خاک صورت گرفت. پس از خشک کردن نمونه‌ها در هوای آزاد و جدا کردن ریشه­ها، سنگ و سایر ناخالصی­ها از آن، کلوخ‌ها خرد و از الک 2 میلی‌متری عبور داده شد. در بررسی فاکتورهای خاک، مجموعه‌ای از خصوصیات فیزیکی و شیمیایی خاک از جمله وزن مخصوص ظاهری به روش کلوخ و پارافین، بافت خاک به روش هیدرومتری، pH خاک با دستگاه pH متر الکتریکی، درصد ماده آلی به وسیله روش Walkley & Black، فسفر قابل‌جذب به روش السون، پتاسیم به وسیله دستگاه طیف‌سنج اتمی و نیتروژن به روش کجلدال اندازه‌گیری شد (14).

در مطالعه حاضر به منظور بررسی رابطه بین ارتفاع غالب گونه راش و متغیرهای خاکی و فیزیوگرافی از مدل خطی و جمعی تعمیم‌یافته در نرم­افزار R استفاده گردید. در این پژوهش با توجه به ماهیت متغیر ارتفاع غالب بعنوان متغیر پاسخ، از توزیع گوسی استفاده شده است.

 

روش­های انتخاب متغیر

هدف از روش‌های انتخاب متغیر انتخاب زیرمجموعه‌ای از متغیرهای پیشگو است که در مفهوم ارائه شده مهم‌ترین هستند. به‌طورکلی متغیرهای پیشگو زیاد در مدل باعث کم شدن اریبی پیش­بینی­ها می­شوند، اما دارای واریانس بالاتری هستند. وجود متغیرهای پیشگو زیاد در مدل رگرسیونی به‌طور معمول باعث (بیش برازش) Over-fitting می­شود درحالی‌که مخالف آن Under-fitting نامیده می­شود (33). در چنین مواردی مجموعه­ای از شیوه­های انتخاب متغیر پیشنهاد می­شود. مهم­ترین روش­ها شامل موارد زیر می­باشند:

1- شیوه انتخاب پیشرو: این شیوه با معادله­ای که تنها یک جمله ثابت دارد و هیچ متغیر پیشگویی را دربر ندارد، شروع می­شود. متغیر اولی که در معادله وارد می­شود متغیری است که بیشترین همبستگی ساده را با متغیر پاسخ Y دارد. اگر ضریب رگرسیون این متغیر اختلاف معنی­داری با صفر داشته باشد در معادله باقی می­ماند و برای متغیر دوم تحقیق می­شود. این روش وقتی خاتمه می­یابد که آخرین متغیری که وارد معادله می­شود یک ضریب رگرسیون معنی­دار نداشته باشد و خطای ­آزمون به 5 درصد برسد (6).

2- شیوه حذف پسرو: در این روش ابتدا کلیه متغیرهای مستقل وارد معادله شده و اثر کلیه متغیرها بر روی متغیر وابسته سنجیده می­شود. اما در این روش به مرور متغیرهای ضعیف­تر، یکی پس از دیگری از معادله خارج شده و نهایتا این مراحل تا زمانی ادامه می­یابد که خطای آزمون معنی­داری به 10 درصد برسد (15).

3- شیوه گام­به­گام: این روش در اصل یک شیوه­ی انتخاب پیشرو است ولی با این شرط اضافی که در هر مرحله امکان حذف یک متغیر را مانند حذف پسرو در نظر می­گیرد. در این شیوه، متغیری که در مراحل قبلی انتخاب وارد معادله شده است ممکن است در مراحل بعدی حذف شود (6). این روش زمانی پایان می­یابد که خطای آزمون معنی­داری به 5 درصد برسد (15).

4- ارزیابی تمام معادلات ممکن: لازمه­ی این روش این است که تمام معادلات رگرسیون دارای یک متغیر مستقل، دو متغیر مستقل، سه متغیر مستقل والی آخر را برازش داد. این معادلات با استفاده از معیار مناسب ارزیابی شده و بهترین مدل رگرسیون گزینش می­گردد. اگر فرض شود که جمله  در تمام معادلات وجود داشته باشد و اگر k متغیر مستقل وجود داشته باشد،  معادله باید بررسی شوند (31).

 

معیارهای انتخاب متغیر

 از جمله معیارهایی که برای ارزیابی پتانسیل زیرمجموعه‌های متغیر­های پیش­بینی کننده استفاده می­شود شامل موارد زیر است (33).

 


 


ضریب تبیین ( )

ضریب تبیین مدل رگرسیون، به‌عنوان نسبتی از تغییرپذیری متغیر پاسخ توصیف شده توسط مدل رگرسیون است که به‌صورت ذیل تعریف شده است:

(2)                                       

در عمل معمول است متغیری که دارای مقدار  R2 بیشتری است به‌عنوان متغیر مهم‌تر انتخاب شود. که این معیار بر پایه حداقل مربعات است و سایر معیار­های ارزیابی بر اساس تئوری حداکثر احتمال می­باشند (34).

 

AIC (معیار اطلاعات آکائیک)

معیار اطلاعات آکائیک به دو روش ایجاد می­شود. عمومی­ترین روش مبتنی بر تعادل نیکویی برازش و سادگی مدل است، و این‌چنین تعریف شده­ است که مدل و متغیر با مقادیر پایین­تر AIC مناسب­­ترین مدل و با اهمیت‌ترین متغیر می­باشد. و رابطه آن به‌صورت ذیل می­باشد (5):

(3)                                     

 یا

(4)         

K (تعداد پارامترهای تخمین زده شده در مدل برازش داده شده) برابر با حد پیچیدگی و p تعداد متغیرهای مدل است (1). معیار AIC وقتی‌که N به سمت بی­نهایت میل می­کند تمایل به انتخاب مدل­هایی دارد که خیلی پیچیده هستند.

 

BIC (معیار اطلاعات Bayesian)

شوارتز[11] (35) معیار اطلاعات Bayesian را پیشنهاد داد و به این صورت تعریف شده­ است که مدل و متغیر دارای مقدار BIC پایین­تر مدل مناسب­تر و متغیر مهم‌تر می­باشد. این معیار برای نمونه­های محدود به علت امتیازهای منفی زیادی که برای پیچیدگی در نظر می­گیرد اغلب مدل­هایی که خیلی ساده­اند را انتخاب می­کند (34). و رابطه آن به‌صورت زیر می­باشد (1 ).

(5)                  

 

معیارهای مورد استفاده برای انتخاب متغیر

در این مطالعه به دلیل پایگاه اطلاعات داخلی منطقه، وجود تعداد زیاد متغیرهای مستقل، دقت در مدل­سازی،  و هم­چنین به دلیل نتایج حاصل از منابع موجود، انتخاب متغیر صورت گرفت. بنابراین به منظور انتخاب متغیرهای تأثیرگذار بر عملکرد گونه راش در مدل خطی تعمیم­یافته از روش گام­به­گام با استفاده از معیارهای AIC و BIC[12] و روش بهترین زیر مجموعه با بهره­گیری از بسته bestglm استفاده شده است. برای انتخاب متغیرهای مهم در مدل جمعی تعمیم­یافته در بسته gam از روش گام­به­گام و معیارهای AIC و BIC در ترکیب با بسته GRASP (Generalized Regression Analysis and Spatial Prediction) که توسط Lehmann و همکاران (2002) ارائه گردید (18)، استفاده شد. به منظور انتخاب مهمترین متغیرها در بسته mgcv  از روش پیشرو با استفاده از معیار AIC و یا روش انقباض[13] و روش بهترین زیرمجموعه استفاده گردید. به منظور مقایسه کارآیی روش­های گزینش متغیر در مدل­های خطی و جمعی تعمیم­یافته از اعتبارسنجی متقابل استفاده گردید. به همین دلیل داده­ها به دو بخش مدل­سازی و اعتبارسنجی تقسیم  شدند. 75 درصد داده­ها به بخش مدل­سازی و 25 درصد باقیمانده نیز به بخش اعتبارسنجی تخصیص داده شد. برای مدل خطی تعمیم­یافته از اعتبارسنجی متقابل با 2500 تکرار استفاده شده است. هم­چنین برای گزینش متغیر در مدل خطی تعمیم­یافته از اعتبارسنجی fold-10 استفاده گردید.

 

معیارهای ارزیابی مدل

در این مطالعه به منظور مقایسه کارآیی مدل­های خطی و جمعی تعمیم­یافته، از معیارهای ارزیابی حاصل از داده­های مدل­سازی نظیر ضریب تبیین[14] و مجذور میانگین مربعات خطا[15] و ضریب تبیین تعدیل یافته[16] استفاده شده است، که روابط آنها به ترتیب در زیر آمده است:

 (6)                                     

 (7)                        

(8)                

 که  مقدار مشاهده شده،  مقدار برازش یافته،  تعداد مشاهده­ها، p تعداد متغیرهای پیشگو،  مقدار مشاهده شده و  مقدار برآورد شده می­باشد.          

 

نتایج

در جدول 1 برای هر یک از روش­های انتخاب متغیر، متوسط تعداد متغیرهای تبیینی موجود در مدل­های برازش یافته حاصل از مجموعه داده­های آموزشی برای متغیر ارتفاع غالب، ارائه شده است. در مدل خطی تعمیم­یافته برازش داده شده، میانگین تعداد متغیرها در روش بهترین زیرمجموعه BIC در مقایسه با سایر روش­ها کمتر می­باشد. همچنین در مدل جمعی تعمیم­یافته برازش یافته، میانگین تعداد متغیرها در روش بهترین زیرمجموعه BIC، در مقایسه با سایر روش­ها کمتر می­باشد.

شکل 1 نمودار خلاصه گرافیکی از نتایج مدل خطی تعمیم­یافته ارائه شده در جدول 1 را نمایش می­دهد. به­طور کلی، در مدل خطی تعمیم­یافته روش­های مبتنی بر AIC مدل­های بزرگتری را ایجاد نمودند؛ به این دلیل که AIC جریمه نسبتاً کوچکی را برای پیچیدگی مدل در نظر می­گیرد. مدل­های حدواسط با استفاده از روش مبتنی بر آزمون F  و BIC ایجاد شدند. از طرف دیگر، RMSE برای مدل­های مبتنی بر BIC بیشتر از AIC می­باشد.

در مدل جمعی تعمیم­یافته نیز مدل بزرگتر با استفاده از روش مبتنی بر AIC و انقباض ایجاد شده و مدل­های حدواسط با استفاده از روش­های پیشرو و روش مبتنی بر BIC و بسته GRASP ایجاد شدند. شکل 2 نمودار گرافیکی از نتایج مدل جمعی تعمیم­یافته در جدول 1 را نمایش می­دهد.

 

 

جدول 1. میانگین تعداد متغیرهای انتخاب شده، ضریب تبیین و RMSE برای معیار ارتفاع غالب

 

 

GLM

GAM       

مدل

 

معیار

Step.

p.value

Step.

AIC

Step.

BIC

Best.

SubSet.AIC

Best.

SubSet.BIC

Shrinkage

Forward

Best.

SubSet.AIC

Best.

SubSet.BIC

 

Grasp

میانگین تعداد متغیر انتخاب شده

6/3

7/5

3/3

6/5

7/2

6

5

6

2

4

ضریب تبیین برای داده مدل­سازی

84/32

77/36

03/32

23/36

33/30

38

36

38

27

11/31

RMSE برای داده مدل­سازی

48/3

38/3

51/3

40/3

56/3

37/3

43/3

36/3

65/3

54/3

ضریب تبیین برای داده اعتبارسنجی

68/20

85/20

98/20

56/20

49/20

50/29

83/30

54/31

21/32

38/24

RMSE برای داده اعتبارسنجی

93/3

95/3

92/3

93/3

91/3

74/3

73/3

73/3

76/3

72/3

 

 

 

 

 

 

با توجه به ضریب تبیین و RMSE حاصل از داده­های مدل­سازی برای مدل خطی تعمیم­یافته در جدول فوق، به دلیل اینکه بیشترین ضریب تبیین و کمترینRMSE بدست آمده مربوط به روش step.AIC است پس عملکرد روش مذکور از بقیه روش­ها مناسب­تر است. اما انتخاب روش بهینه گزینش متغیر، براساس داده­های اعتبارسنجی صورت می­گیرد. با توجه به معیارهای بدست آمده برای این داده­­ها، عملکرد روش­ها تقریبا شبیه هم می­باشد ولی روش step.BIC عملکرد بهتری دارد. از آنجا که بین دقت و پیچیدگی مدل باید توازن و تعادلی برقرار باشد، روش step.BIC به­عنوان روش گزینش متغیر در مدل خطی تعمیم­یافته برای ارتفاع غالب انتخاب می­شود.

در مدل جمعی تعمیم­یافته برای متغیر ارتفاع غالب نیز روش بهترین زیرمجموعه AIC  بهترین عملکرد را دارد. همان­طور که اشاره شد بین دقت مدل و پیچیدگی مدل باید توازنی برقرار باشد. از این رو روش بهترین زیرمجموعه AIC به­عنوان روش گزینش متغیر انتخاب می­گردد.

 

 

 

شکل 1. میانگین تعداد متغیرهای انتخاب شده برای ارتفاع غالب با استفاده از پنج روش در مدل خطی تعمیم­یافته

 

 

شکل 2. میانگین تعداد متغیرهای انتخاب شده برای ارتفاع غالب با استفاده از پنج روش در مدل جمعی تعمیم­یافته

 

 


تعیین اهمیت هر کدام از متغیرهای مهم

پس از انتخاب روش گزینش متغیر در هریک از مدل­ها، اهمیت نسبی هر یک از متغیرهای مهم را به دست آورده و مهمترین متغیر اثرگذار را در دو مدل خطی و جمعی تعمیم­یافته برای معیارهای عملکرد گونه راش انتخاب نمودیم. برای به دست آوردن اهمیت نسبی متغیرها از بسته MuMIn در نرم­افزار R استفاده شده است. که نتایج آن را در جدول 2 مشاهده می­کنید.

 

 

 

جدول 2. اهمیت نسبی متغیرهای مهم بر معیارهای عملکرد گونه راش

معیار عملکرد

متغیر

ارتفاع غالب

GLM

GAM

Step.BIC

Best.SubSet.AIC

Altitude

9998/0

1

Bulk_Density

-

-

Clay

9994/0

89/0

CN

-

-

K

7565/0

97/0

N

8078/0

69/0

P

-

89/0

pH

-

-

Silt

-

75/0

Slope

-

-

TRASP

-

-

 

با توجه به جدول (2) برای معیارهای عملکرد گونه راش در مدل­های خطی و جمعی تعمیم­یافته ، متغیر ارتفاع از سطح دریا دارای بیش­ترین درجه اهمیت بوده و به عنوان مهم­ترین متغیر محیطی اثرگذار بر هر سه معیار عملکرد گونه راش شناسایی گردید.

شکل­های زیر نوع ارتباط معیارهای عملکرد گونه راش را با متغیرهای محیطی را نشان می­دهند.

 

 

 

 

 

 

 

 

شکل 3. نمودار رابطه بین متغیرهای محیطی اثرگذار و معیار عملکرد ارتفاع غالب گونه راش

 

 


قابلیت پیش­بینی

مقایسه روش­های مبتنی بر رگرسیون

در مدل خطی تعمیم­یافته مقایسه مجذور میانگین مربعات خطا و ضریب تبیین برای روش­های مبتنی بر رگرسیون حکایت از شباهت مقادیر مرتبط با رویکردهای مبتنی بر رگرسیون  دارد. با وجود تعداد زیاد متغیر پیشگو در روش­های مبتنی بر AIC در مقایسه با روش­های F-test و BIC که منتج به ضریب تبیین بیشتر برای داده­های مدل­سازی گردیده است، متوسط قابلیت پیش­بینی تمام پنج روش تقریباً یکسان بوده است.

 

مقایسه عملکرد مدل­های خطی و جمعی تعمیم­یافته

در این مطالعه به‌منظور ارزیابی عملکرد مدل خطی و جمعی تعمیم­یافته از معیارهای ضریب تبیین و مجذور میانگین مربعات خطا حاصل از داده­های مدل­سازی استفاده گردید. با توجه به جدول شماره 3 مدل جمعی تعمیم­یافته بیشترین ضریب تبیین و کمترین مجذور میانگین مربعات خطا را دارد بنابراین مدل مذکور عملکرد بهتری نسبت به مدل خطی تعمیم­یافته دارد.

 

جدول3. معیارهای ارزیابی مدل­های خطی و جمعی تعمیم یافته برای ارتفاع غالب گونه راش

معیار عملکرد

ارتفاع غالب

معیار ارزیابی

RMSE

R2%

 

مدل خطی تعمیم­یافته

55/3

31

29

مدل جمعی تعمیم­یافته

36/3

38

35

 

بحث و نتیجه­گیری

بررسی شایستگی و کفایت مدل رگرسیون خطی تعمیم­یافته

در مطالعه حاضر عملکرد روش­های مختلف انتخاب متغیر در مدل خطی تعمیم­یافته مورد بررسی قرار گرفت. قابلیت پیش­بینی روش­های مبتنی بر رگرسیون تقریباً مشابه بوده است. هر چند اندازه مدل­ها متفاوت بوده است اما در خصوص قابلیت پیش­بینی، تفاوت اندکی بین روش گام­به­گام و روش بهترین زیرمجموعه­ها وجود دارد. این نتایج با اظهارات برخی از بوم­شناسان در مورد ضعف روش گام­به­گام مغایرت دارد (25، 39).

روش­های مبتنی بر معیار اطلاعات آکائیک­هایی با بیشترین تعداد متغیر پیشگو را ایجاد نمودند. از آن­جا که قابلیت پیش­بینی این مدل­ها به­طور قابل توجهی بهتر از مدل­های حاصل ازروش آزمون F و  BICنبوده است، از این­رو انتخاب تکنیک­های گزینش متغیر باید براساس ملاحظات دیگر صورت گیرد. همان­طور که Murtaugh (1998) اشاره می­نماید محقق ممکن است یک روش گزینش متغیر محافظه­کارانه­تر (F-test یا BIC) و یا روش­های آزادانه­تر (AIC) را ترجیح دهد.

بسیاری از متخصصان آمار اشاره دارند که تفسیر p-value متغیرهای تبیینی در مدل رگرسیون مشکل یا غیرممکن است، چرا که p-value عدم قطعیت در ساخت مدل را توضیح نمی­دهد (30، 23). برخی از محققین استفاده از آزمون F در انتخاب متغیر را بد جلوه داده­اند (4،25). با این وجود آماره F می­تواند یک رویکرد ارزشمند در بیان توازن بین تغییرات توجیه شده و پیچیدگی مدل باشد. در واقع F-to-enter ، ضریب تبیین تعدیل یافته، و AIC می توانند به عنوان موارد خاص از شکل آماره مالو Cp تلقی شوند (23). بطور مثال در جدول (4-1) با اعمال روش انتخاب گام­به­گام (روش 1) با توجه به مقدار p-value (در آستانه 05/0) میانیگن تعداد متغیر 6/3 بدست می­آید. چنانچه از آستانه 01/0 استفاده گردد، مدل به طور متوسط 2/3 متغیری ایجاد می­شود. در نهایت، با استفاده از آستانه 10/0 مدل 6/4 متغیری ایجاد می­شود. از این رو، هنگامی که استفاده از AIC و یا BIC به تنهایی امکان­پذیر نیست سطح معنی­داری آزمون F می­تواند بعنوان پارامتر تنظیم جریمه پیچیدگی مدل در نظر گرفته شود (32). در این زمینه رد کردن روش انتخاب گام­به­گام متغیر با استفاده از آزمون Fبعنوان ابزار مناسب برای گزینش، تنها به خاطر استفاده از آزمون فرضیه ناعادلانه به نظر می­رسد (20،39).

یادآوری این نکته مهم است که مقایسه روش­های گزینش در مطالعه حاضر بر اساس قابلیت پیش­بینی است، چنانچه هدف از مدل­سازی تبیین یا شناسایی روابط علت و معلولی باشد معیار مقایسه روش­ها می­تواند از معیارهایی که در اینجا در نظر گرفته شده متفاوت باشد. در زمان ساخت مدل، بین دو هدف اصلی باید تمایز قائل شد. هدف اول پیش­بینی است که در آن ساختار مدل از ملاحظه کمی برخوردار است و هدف دوم، تبیین است که در آن تلاش می­شود متغیرهای پیشگوی مهم شناسایی شود و بینشی نسبت به رابطه بین متغیر پیشگو و متغیر پاسخ از طریق ساختار مدل حاصل گردد. در خصوص پیش­بینی، برازش مدل و مجذور میانگین مربعات خطای پیش­بینی معیارهای اصلی برای کفایت مدل می­باشند (32).

نکته مهم دیگر این است که استفاده از داده­های واقعی در مطالعه حاضر، به جای داده شبیه­سازی، استنباط و نتیجه­گیری مربوطه را دشوار می­سازد. از طرفی دیگر، نمونه­برداری از مجموعه داده­ها که نتایج را به جمعیت بزرگتر تعمیم دهد، نیز کار دشواری است (27). در مطالعه حاضر از 127 قطعه نمونه استفاده گردیده است. افزایش شدت نمونه­برداری می­تواند تاحدی بر مسائل فوق فایق آید. شبیه­سازی تنها روش مشخص برای مقاسیه تکنیک­های مدل­سازی است که در آن مدل درست شناخته می­شود. پژوهشگران داده­های شبیه­سازی شده بسیار مختلفی را در اختیار دارند و از معیارهای مختلفی برای مقایسه روش­هایی که ترکیب نتایج آنها دشوار است استفاده می­نمایند (27). Raffalovich و همکاران (2008) قابلیت روش­های متعدد در ملحوظ نمودن متغیرهای مهم و حذف متغیرهای نامربوط را مورد ارزیابی قرار دادند و دریافتند که روش­های مبتنی بر رگرسیون گام­به­گام و BIC بهترین عملکرد را دارند، در صورتی که روش­های مبتنی بر AIC کارایی نامناسبی داشتند و از آن­ها باید اجتناب نمود. Murtaugh (1998) از سوی دیگر تفاوت اندکی در قابلیت روش­های مبتنی بر آزمون F، BIC و Cp مشاهده نمود. Murtaugh در سال 2009 نیز دریافت که عملکرد روش­های گام­به­گام و بهترین زیرمجموعه مشابه می­باشد و انتخاب معیار برای مقایسه مدل­ها (AIC، BIC و آماره F) تأثیر اندکی بر قابلیت پیش­بینی دارد. نتایج مطالعه حاضر که در آن بهترین روش برای انتخاب مدل آماری وجود ندارد، با مطالعات Murtaugh (2009) مطابقت دارد. لازم به ذکر است که گستره وسیعی از روش­های گزینش متغیر وجود دارد، که هرکدام از آنها می­تواند مدل­های ارزشمندی ایجاد کند که برای کاربرد خاصی مورد توجه قرار گیرد. این که کدام مدل مفیدترین می­باشد، با استفاده از روش بدست آمدن مدل­ها تعیین نمی­گردد، بلکه بیشتر از طریق متناسب بودن آن مدل برای آن هدف تعیین می­شود (27).

بررسی مدل‏سازی عملکرد گونه راش با استفاده از مدل جمعی تعمیم­یافته

بهره­گیری از مدل جمعی تعمیم‌یافته در این مطالعه در پیش­بینی معیارهای عملکرد راش شرقی نسبت به متغیرهای محیطی نشان داد که مدل جمعی تعمیم‌یافته به دلیل دارا بودن هموارسازهای قوی قادر به کشف روابط غیرخطی بین متغیرها بوده و قادر است پیش‏بینی دقیقی از معیارهای عملکرد ارائه دهد. نتایج این مطالعه نشان داد که کارایی مدل جمعی تعمیم­یافته در ارزیابی عملکرد گونه راش مناسب می­باشد. Moisen و همکاران (2006) نیز حضور و غیاب و سطح مقطع در هکتار گونه­های مختلف را با استفاده از مدل­های جمعی تعمیم‌یافته، درخت رگرسیون تقویت شده و روش‌های درخت مبنا پیش­بینی نمودند و نتیجه گیری نمودند مدل­های جمعی تعمیم­یافته (GAM) و درخت رگرسیون تقویت شده (BRT) نتایج بهتری را ارائه دادند. هم­چنین Aertsen و همکاران (2010) نیز مدل جمعی تعمیم‌یافته (GAM) را به عنوان مناسب‏ترین روش مدل­سازی توان تولیدی رویشگاه در جنگل­های کوهستانی مدیترانه­ای در جنوب ترکیه معرفی نمودند.

در این پژوهش از مدل جمعی تعمیم یافته برای بررسی رابطه عملکرد گونه راش نسبت به متغیرهای محیطی استفاده شد و نتایج قابل قبولی نیز به­دست آمده است. با توجه به نتایج مطالعه حاضر شش متغیر ارتفاع از سطح دریا، درصد رس، مقدار پتاسیم، درصد ازت، مقدار فسفر و درصد سیلت ارتباط معنی­داری با ارتفاع غالب گونه راش و چهار متغیر ارتفاع از سطح دریا، درصد رس، درصد ازت و مقدار آزیموت نیز ارتباط معنی­داری با سطح مقطع گونه راش دارند. علاوه بر این هشت متغیر ارتفاع از سطح دریا، جرم مخصوص ظاهری، درصد CN، مقدار فسفر، مقدار اسیدیته خاک، درصد سیلت، درصد شیب و مقدار آزیموت بر معیار عملکرد تراکم گونه راش اثرگذار می­باشند. همان­طور که اشاره شد با توجه به معیار اهمیت نسبی، ارتفاع از سطح دریا مهم­ترین متغیر اثرگذار برمعیارهای عملکرد گونه راش شناسایی شد.

از مدل‏های جمعی برای مدل‏سازی انواع داده­ها با مقیاس­های مختلف در سایر علوم نیز استفاده گردیده است که در آن­ها برتری مدل‏های جمعی تعمیم یافته بر مدل‏های خطی تعمیم یافته نشان داده شده است. در خاتمه باید خاطر نشان کرد که بیان ریاضی روابط بین متغیرهای محیطی و عکس­العمل گونه­ها تنها کمکی برای تفسیر مشاهدات میدانی است و حتی قوی­ترین همبستگی­ها را نمی‏توان قطعی فرض کرد.

 

 

نتیجه­گیری

 

یکی از زمینه­های مطرح در اکولوژی پوشش گیاهی، تحلیل و درک روابط عملکرد گونه گیاهی و عوامل رویشگاهی است. شناخت رابطه بین عوامل محیطی با پراکنش و عملکرد گونه­های گیاهی نقش مهمی در طرح­های زیست­ محیطی و مدیریتی ایفا می‌نماید. در این مطالعه تعداد 127 قطعه نمونه دایره­ای شکل با مساحت 1000 مترمربع به صورت سیستماتیک تصادفی در جنگل آموزشی و پژوهشی دانشگاه تربیت مدرس پیاده شد و ارتفاع و قطر تمام درختان گونه راش شرقی در هر پلات اندازه‏گیری شد و از عمق صفر تا 10 سانتی‏متری نمونه خاک تهیه گردید. داده­های جمع­آوری شده در این مطالعه را به دو دسته داده­ مدل­سازی و اعتبارسنجی تقسیم نمودیم. به منظور بررسی رابطه بین عملکرد گونه راش و متغیرهای خاکی و فیزیوگرافی از مدل خطی و جمعی تعمیم‌یافته در نرم­افزار R استفاده ­گردید. در این پژوهش مدل جمعی تعمیم­یافته با استفاده از دو بسته آماری mgcv و gam در نرم­افزار R برازش داده شد. در هر­یک از مدل­های خطی و جمعی، روش­های انتخاب گزینش متغیر اجرا گردید و درنهایت نتایج نشان داد که در مدل خطی تعمیم­یافته برازش داده شده به معیارهای ارتفاع غالب، سطح مقطع و تراکم به ترتیب روش­های Step. BIC، Best. SubSet. AIC و Step.AIC بعنوان بهترین روش انتخاب متغیر، معرفی شدند. در این مطالعه مدل خطی تعمیم­یافته توانست 31 درصد تغییرات ارتفاع غالب، 73/9 درصد تغییرات سطح مقطع و 67/18 درصد تغییرات تراکم را توجیه کند.

در مدل جمعی تعمیم­یافته نیز روش Best.SubSet.AIC بعنوان بهترین روش گزینش متغیر برای معیارهای عملکرد گونه راش شناسایی شد. در این مطالعه مدل جمعی تعمیم­یافته توانست بیش از 38 درصد تغییرات ارتفاع غالب، 23 درصد تغییرات سطح مقطع و 6/38 درصد تغییرات تراکم را به کمک متغیرهای محیطی مورد بررسی توجیه نماید.

با مقایسه مدل­های خطی و جمعی تعمیم­یافته با استفاده از معیارهای ضریب تبیین و مجذور میانگین مربعات خطا حاصل از داده­های مدل­سازی، مشاهده می­شود بیشترین ضریب تبیین و کمترین مجذور میانگین مربعات خطا مربوط به مدل جمعی تعمیم­یافته است بنابراین می­توان گفت مدل جمعی تعمیم یافته از نظر معیارهای ارزیابی عملکرد بهتری نسبت به مدل خطی تعمیم­یافته دارد.

 

 


Refrences

 

1- Aertsen, W., V.  Kint, B. De Vos, J. Deckers, J. Van Orshoven, & B. Muys, 2010. Comparison and ranking of different modelling techniques for prediction of site index in Mediterranean mountain forests. Ecological Modeling, 221(8): 1119-1130.

2- Alder, D, 1980. Forest volume estimation and yield prediction, F.A.O. Publication, Rome.

3- Berges, L., R. Chevalier, Y. Dumas, A.  Franc, J.M. Gilbert, 2005. Sessile oak (Quercus petraea Liebl.) site index variations in relation to climate, topography and soil in even-aged high-forest stands in northern France. Annals of Forest Science, 62(5): 391-402.

4- Burnham, K.P., D.R. Anderson, 2002. Model selection and multimodel inference: A practical information-theoretic approach, 2nd edition, Springer, New York.

5- Burnham, K.P., D.R. Anderson, K.P. Huyvaert, 2011. AIC model selection and multimodel inference in behavioral ecology: some background, observations, and comparisons. Behavioral Ecology and Sociobiology 65:23-35.

6- Chatterjee, S., S.A. Hadi, & B. Price, 2004. Regression Analysis by Example. Niroumand, H.A., Publishers University of Mashhad, 384p.

7- Fakoor, E., 2014. Evaluating the site productivity of Oriental Beech using data mining techniques (decision tree). Master's thesis, University of Tarbiat Modares, 79p.

8- Gerritsen, J., J.M. Dietz, & H.T. Wilson, 1996. Episodic acidification of coastal plain streams: an estimation of risk to fish. Ecological Applications, 6(2): 438–448.

9- Hastie, T., R. Tibshirani, 1986. Generalized Additive Model. Statistical sincence, 1(3):297-318.

10- Hastie, T., R. Tibshirani, 1990. Non-parametric logistic and proportional odds regression. Applied statistics, 260-276.

11- Heegaard, E., 2002. The outer border and central border for species–environmental relationships estimated by non-parametric generalised additive models. Ecological Modelling, 157(2): 131-139.

12- Hobbs, N.T., & R. Hilborn, 2006. Alternatives to statistical hypothesis testing in ecology: A guide to self-teaching. Ecological Applications, 16(1): 5–19.

13- Hoeting, J.A., R.A. Davis, A.A. Merton, & S.E. Thompson, 2006. Model selection for geostatistical models. Ecological Applications, 16: 87–98.

14- Jafarihaghighi, M., 2003. Methods of soil analysis, Publication voice of Zoha, 236p, Sari.

15- Kalantari, KH., 2010. Processing and analyzing data in social - economic research, Saba Cultural Publications, 388 p.

 

16- Knick, S.T., & J.T. Rotenberry, 1995. Landscape characteristics of fragmented shrubsteppe habitats and breeding passerine birds. Conservation Biology, 9(5): 1059–1071.

17- Lee, H., & S. Ghosh, 2009. Performance of information criteria for spatial models. Journal of Statistical Computation and Simulation, 79(1): 93–106.

18- Lehmann, A., J.M. Overton, J.R. Leathwick, 2002. GRASP: generalized regression analysis and spatial prediction. Ecological modelling, 157(2): 189-207.

19- Leigh, G.T., A.J. Read, & P. Halpin, 2008. Fine-scale habitat modeling of a top marine predator: do prey data improve predictive capacity. Ecological Applications, 18(7): 1702–1717.

20- Lukacs, P.M., W.L. Thompson, W.L. Kendall, W.R. Gould, Jr P.F. Doherty, K.P. Burnham, & D.R. Anderson, 2007. Concerns regarding a call for pluralism of information theory and hypothesis testing. Journal of Applied Ecology, 44(2): 456–460.

21- Mazerolle, M.J., 2006. Improving data analysis in herpetology: using Akaike’s information criterion (AIC) to assess the strength of biological hypotheses. Amphibia-Reptilia, 27(2): 169–180.

22- McLintock, T.F., & C.A. Bickford, 1957. A proposed site index for red spruce in the Northeast, Publication of Northeastern Forest Experiment Station, U.S. Upper Darby.

23- Miller, A., 2002. Subset Selection in Regression, 2nd edition, Chapman & Hall/CRC, Boca Raton, Florida.

24- Moisen, G.G., E.A. Freeman, J.A. Blackard, T.S. Frescino, N.E. Zimmermann, & Jr T.C. Edwards, 2006. Predicting tree species presence and basal area in Utah: a comparison of stochastic gradient boosting, generalized additive models, and tree-based methods. Ecological modelling, 199(2): 176-187.

25- Mundry, R., & C.L. Nunn, 2009. Stepwise model fitting and statistical inference: turning noise into signal pollution. The American Naturalist, 173(1): 119–123.

26- Murtaugh, P.A., 1998. Methods of variable selection in regression modeling. Communications in Statistics: Simulation and Computation, 27(3): 711–734.

27- Murtaugh, P.A., 2009. Performance of several variable‐selection methods applied to real ecological data. Ecology Letters, 12(10): 1061-1068.

28- Olden, J.D., & D.A. Jackson, 2000. Torturing data for the sake of generality: How valid are our regression models? Ecoscience, 7(4): 501–510.

29- Raffalovich, L.E., G.D. Deane, D. Armstrong, & H.S. Tsao, 2008. Model selection procedures in social research: Monte-Carlo simulation results. Journal of Applied Statistics, 35(10): 1093–1114.

30- Ramsey, F., & D. Schafer, 2002. The Statistical Sleuth: A Course in Methods of Data Analysis, 2nd edition, Duxbury Press, Belmont, California.

31- Rezaei, A., & A. Soltani, 2003. Introduction to Applied Regression Analysis, Isfahan University Press, 294 p.

32- Sauerbrei, W., P. Royston, & H. Binder, 2007. Selection of important variables and determination of functional form for continuous predictors in multivariable model building. Statistics in Medicine, 26(30): 5512–5528.

33- Sharifi, A.M., 2014. Evaluate the response species Festuca ovina L to some environmental variables using HOF function in catchment's Galandrud, Master's thesis Department of Natural Resources Tarbiat Modares University.

34-Sheather, S., 2009. A Modern Approach to Regression with R, Springer Texts in Statistics, Springer, 393 pp.

35- Schwarz, G., 1978. Estimating the dimension of a model. Annals of Statistics 6:461–464.

36- Skovsgaard, J.P., & J.K. Vanclay, 2008. Forest site productivity: a review of the evolution of dendrometric concepts for even-aged stands. Journal of Forestry,81(1): 13–31.

37- Vanclay, J.K., 1992. Assessing site productivity in tropical moist forests: a review. Forest Ecology and Management, 54(1): 257-287.

38- Ward, E.J., 2008. A review and comparison of four commonly used Bayesian and maximum likelihood model selection tools. Ecological Modelling, 211(1): 1–10.

39- Whittingham, M.J., P.A. Stephens, R.B. Bradbury, & R.P. Freckleton, 2006. Why do we still use stepwise modelling in ecology and behaviour? Journal of Animal Ecology, 75(5): 1182–1189.

40- Yee, T.W., N.D. Mitchell, 1991. Generalized additive models in plant ecology, Journal of Vegetation Science, 2(5): 587-602.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 



[1]- نویسنده مسئول: کارشناسی ارشد جنگلداری، دانشکده منابع طبیعی و علوم دریایی، دانشگاه تربیت مدرس، نور، ایران.

Email: somaye8030@gmail.com

[2] - استادیار گروه جنگلداری، دانشکده منابع طبیعی و علوم دریایی، دانشگاه تربیت مدرس، نور، ایران

[3] - استاد گروه جنگلداری، دانشکده منابع طبیعی و علوم دریایی، دانشگاه تربیت مدرس، نور، ایران

[4]Generalized Linear Models (GLM)

[5] Generalized Additive Models (GAM)

[6] Data Mining

[7] Classification and  Regression Trees (CART)

[8] Artificial Neural Networks (ANN)

[9] Boosted Regression Trees (BRT)

[10]- Radiation Index

[11] Schwarz

[12] Akaike and Baysian Information Criterion                                                       

[13] Shrinkage Method                                                                                                                       

[14] Coefficient of Determination

2 Root Mean Square Error (RMSE)

[16] Adjusted Coefficient of Determination

Refrences

 

1- Aertsen, W., V.  Kint, B. De Vos, J. Deckers, J. Van Orshoven, & B. Muys, 2010. Comparison and ranking of different modelling techniques for prediction of site index in Mediterranean mountain forests. Ecological Modeling, 221(8): 1119-1130.

2- Alder, D, 1980. Forest volume estimation and yield prediction, F.A.O. Publication, Rome.

3- Berges, L., R. Chevalier, Y. Dumas, A.  Franc, J.M. Gilbert, 2005. Sessile oak (Quercus petraea Liebl.) site index variations in relation to climate, topography and soil in even-aged high-forest stands in northern France. Annals of Forest Science, 62(5): 391-402.

4- Burnham, K.P., D.R. Anderson, 2002. Model selection and multimodel inference: A practical information-theoretic approach, 2nd edition, Springer, New York.

5- Burnham, K.P., D.R. Anderson, K.P. Huyvaert, 2011. AIC model selection and multimodel inference in behavioral ecology: some background, observations, and comparisons. Behavioral Ecology and Sociobiology 65:23-35.

6- Chatterjee, S., S.A. Hadi, & B. Price, 2004. Regression Analysis by Example. Niroumand, H.A., Publishers University of Mashhad, 384p.

7- Fakoor, E., 2014. Evaluating the site productivity of Oriental Beech using data mining techniques (decision tree). Master's thesis, University of Tarbiat Modares, 79p.

8- Gerritsen, J., J.M. Dietz, & H.T. Wilson, 1996. Episodic acidification of coastal plain streams: an estimation of risk to fish. Ecological Applications, 6(2): 438–448.

9- Hastie, T., R. Tibshirani, 1986. Generalized Additive Model. Statistical sincence, 1(3):297-318.

10- Hastie, T., R. Tibshirani, 1990. Non-parametric logistic and proportional odds regression. Applied statistics, 260-276.

11- Heegaard, E., 2002. The outer border and central border for species–environmental relationships estimated by non-parametric generalised additive models. Ecological Modelling, 157(2): 131-139.

12- Hobbs, N.T., & R. Hilborn, 2006. Alternatives to statistical hypothesis testing in ecology: A guide to self-teaching. Ecological Applications, 16(1): 5–19.

13- Hoeting, J.A., R.A. Davis, A.A. Merton, & S.E. Thompson, 2006. Model selection for geostatistical models. Ecological Applications, 16: 87–98.

14- Jafarihaghighi, M., 2003. Methods of soil analysis, Publication voice of Zoha, 236p, Sari.

15- Kalantari, KH., 2010. Processing and analyzing data in social - economic research, Saba Cultural Publications, 388 p.

 

16- Knick, S.T., & J.T. Rotenberry, 1995. Landscape characteristics of fragmented shrubsteppe habitats and breeding passerine birds. Conservation Biology, 9(5): 1059–1071.

17- Lee, H., & S. Ghosh, 2009. Performance of information criteria for spatial models. Journal of Statistical Computation and Simulation, 79(1): 93–106.

18- Lehmann, A., J.M. Overton, J.R. Leathwick, 2002. GRASP: generalized regression analysis and spatial prediction. Ecological modelling, 157(2): 189-207.

19- Leigh, G.T., A.J. Read, & P. Halpin, 2008. Fine-scale habitat modeling of a top marine predator: do prey data improve predictive capacity. Ecological Applications, 18(7): 1702–1717.

20- Lukacs, P.M., W.L. Thompson, W.L. Kendall, W.R. Gould, Jr P.F. Doherty, K.P. Burnham, & D.R. Anderson, 2007. Concerns regarding a call for pluralism of information theory and hypothesis testing. Journal of Applied Ecology, 44(2): 456–460.

21- Mazerolle, M.J., 2006. Improving data analysis in herpetology: using Akaike’s information criterion (AIC) to assess the strength of biological hypotheses. Amphibia-Reptilia, 27(2): 169–180.

22- McLintock, T.F., & C.A. Bickford, 1957. A proposed site index for red spruce in the Northeast, Publication of Northeastern Forest Experiment Station, U.S. Upper Darby.

23- Miller, A., 2002. Subset Selection in Regression, 2nd edition, Chapman & Hall/CRC, Boca Raton, Florida.

24- Moisen, G.G., E.A. Freeman, J.A. Blackard, T.S. Frescino, N.E. Zimmermann, & Jr T.C. Edwards, 2006. Predicting tree species presence and basal area in Utah: a comparison of stochastic gradient boosting, generalized additive models, and tree-based methods. Ecological modelling, 199(2): 176-187.

25- Mundry, R., & C.L. Nunn, 2009. Stepwise model fitting and statistical inference: turning noise into signal pollution. The American Naturalist, 173(1): 119–123.

26- Murtaugh, P.A., 1998. Methods of variable selection in regression modeling. Communications in Statistics: Simulation and Computation, 27(3): 711–734.

27- Murtaugh, P.A., 2009. Performance of several variable‐selection methods applied to real ecological data. Ecology Letters, 12(10): 1061-1068.

28- Olden, J.D., & D.A. Jackson, 2000. Torturing data for the sake of generality: How valid are our regression models? Ecoscience, 7(4): 501–510.

29- Raffalovich, L.E., G.D. Deane, D. Armstrong, & H.S. Tsao, 2008. Model selection procedures in social research: Monte-Carlo simulation results. Journal of Applied Statistics, 35(10): 1093–1114.

30- Ramsey, F., & D. Schafer, 2002. The Statistical Sleuth: A Course in Methods of Data Analysis, 2nd edition, Duxbury Press, Belmont, California.

31- Rezaei, A., & A. Soltani, 2003. Introduction to Applied Regression Analysis, Isfahan University Press, 294 p.

32- Sauerbrei, W., P. Royston, & H. Binder, 2007. Selection of important variables and determination of functional form for continuous predictors in multivariable model building. Statistics in Medicine, 26(30): 5512–5528.

33- Sharifi, A.M., 2014. Evaluate the response species Festuca ovina L to some environmental variables using HOF function in catchment's Galandrud, Master's thesis Department of Natural Resources Tarbiat Modares University.

34-Sheather, S., 2009. A Modern Approach to Regression with R, Springer Texts in Statistics, Springer, 393 pp.

35- Schwarz, G., 1978. Estimating the dimension of a model. Annals of Statistics 6:461–464.

36- Skovsgaard, J.P., & J.K. Vanclay, 2008. Forest site productivity: a review of the evolution of dendrometric concepts for even-aged stands. Journal of Forestry,81(1): 13–31.

37- Vanclay, J.K., 1992. Assessing site productivity in tropical moist forests: a review. Forest Ecology and Management, 54(1): 257-287.

38- Ward, E.J., 2008. A review and comparison of four commonly used Bayesian and maximum likelihood model selection tools. Ecological Modelling, 211(1): 1–10.

39- Whittingham, M.J., P.A. Stephens, R.B. Bradbury, & R.P. Freckleton, 2006. Why do we still use stepwise modelling in ecology and behaviour? Journal of Animal Ecology, 75(5): 1182–1189.

40- Yee, T.W., N.D. Mitchell, 1991. Generalized additive models in plant ecology, Journal of Vegetation Science, 2(5): 587-602.