基于类别相关性和交叉熵的特征选择方法_朱颢东
黑蜈蚣叶属(蜈蚣衣科)_地衣一新种

㊀Guihaia㊀Apr.2024ꎬ44(4):621-628http://www.guihaia-journal.comDOI:10.11931/guihaia.gxzw202311012蒋树浩ꎬ贾泽峰ꎬ2024.黑蜈蚣叶属(蜈蚣衣科)地衣一新种[J].广西植物ꎬ44(4):621-628.JIANGSHꎬJIAZFꎬ2024.AnewspeciesofthelichengenusPhaeophyscia(Physciaceae)[J].Guihaiaꎬ44(4):621-628.黑蜈蚣叶属(蜈蚣衣科)地衣一新种蒋树浩ꎬ贾泽峰∗(聊城大学生命科学学院ꎬ山东聊城252059)摘㊀要:该文基于形态学㊁解剖学㊁化学及分子系统学的方法ꎬ对采自中国泰山的黑蜈蚣叶属地衣进行了分类学研究ꎬ发现了1新种ꎬ即泰山黑蜈蚣叶(Phaeophysciataishanensis)ꎮ该新种的主要特征为地衣体上表面末端具稀疏的皮层毛ꎻ髓层白色ꎻ下表面黑色ꎬ裂片末端处呈灰白色或浅褐色ꎻ盘托上部偶有白色或浅色的皮层毛ꎬ常常稀疏可数ꎻ子囊孢子褐色ꎬ厚壁ꎬPhyscia型ꎬ孢子大小为(18.0~20.5)μmˑ(9.0~10.0)μmꎮ该文还基于表型特征讨论了新种与相似种的异同ꎬ并基于分子数据以ITS序列构建最大似然系统发育树且进行了序列分析ꎬ同时提供了详细的形态学描述及特征图片ꎮ该新种的发现为蜈蚣衣科地衣生物多样性研究积累了基础资料ꎮ关键词:地衣型真菌ꎬ粉衣目ꎬ蜈蚣衣科ꎬ系统发育ꎬ分类学中图分类号:Q949.34㊀㊀文献标识码:A㊀㊀文章编号:1000 ̄3142(2024)04 ̄0621 ̄08AnewspeciesofthelichengenusPhaeophyscia(Physciaceae)JIANGShuhaoꎬJIAZefeng∗(CollegeofLifeSciencesꎬLiaochengUniversityꎬLiaocheng252059ꎬShandongꎬChina)Abstract:BasedonmorphologicalꎬanatomicalꎬchemicalandmolecularsystematicmethodsꎬataxonomicstudywascarriedoutonthelichengenusPhaeophysciacollectedfromMountTai.OnespeciesꎬP.taishanensisisreportedasnewtoscience.Itischaracterizedbythefollowingcharacters:whiteorhyalinecorticalhairssparselyontheuppersurfaceofthemarginalperipheralzonesofthelobesꎻwhitemedullaꎻblacklowersurfacewithsometimeswhiteorpalebrownendsꎻsparsecorticalhairsoccasionallyonupperportionofthallinemarginꎻandascosporesbrownꎬPhyscia ̄typeꎬsized(18.0-20.5)μmˑ(9.0-10.0)μm.Basedonphenotypicalcharacteristicsꎬthesimilaritiesanddifferencesbetweenthenewspeciesandsimilarspecieswerediscussed.themaximumlikelihoodphylogenetictreewasconstructedwithITSsequenceꎬandthesequenceanalysiswascarriedout.Adetailedmorphologicaldescriptionandpicturesofthecharacteristicsofthisnewspeciesareprovided.ThediscoveryofthisnewspecieshasaccumulatedbasicdataforthestudyofPhysciaceaebiodiversity.Keywords:lichenizedfungiꎬCalicialesꎬPhysciaceaeꎬphylogenyꎬtaxonomy收稿日期:2024-01-18㊀接受日期:2024-02-22基金项目:国家自然科学基金(37150001)ꎮ第一作者:蒋树浩(2000 )ꎬ硕士研究生ꎬ研究方向为地衣生物学ꎬ(E ̄mail)jsh20000522@163.comꎮ∗通信作者:贾泽峰ꎬ博士ꎬ教授ꎬ研究方向为地衣生物学ꎬ(E ̄mail)zfjia2008@163.comꎮ㊀㊀黑蜈蚣叶属(PhaeophysciaMoberg)隶属于子囊菌门(Ascomycota)茶渍纲(Lecanoromycetes)ꎬ粉衣目(Caliciales)蜈蚣衣科(Physciaceae)ꎬ全世界有66种ꎬ中国已报道21种(魏江春ꎬ2020ꎻ陈健斌和胡光荣ꎬ2022ꎻWijayawardeneetal.ꎬ2022ꎻ陈健斌ꎬ2023)ꎮ黑蜈蚣叶属(Phaeophyscia)是Moberg于1977年以Phaeophysciaorbicularis(Neck.)Moberg为模式建立的ꎬ除强调皮层结构㊁地衣化学之外ꎬ他还强调分生孢子在地衣分属中的重要性ꎮ于是ꎬ从蜈蚣衣属Physcia中分出该属ꎬ包括原蜈蚣衣属中那些皮层K-ꎬ不含atranorinꎬ下皮层为假薄壁组织ꎬ个别为假厚壁长细胞组织ꎬ分生孢子为近椭圆形且小于4μm长的类群(Mobergꎬ1977)ꎮ后来ꎬEsslinger承认且沿用了Moberg的黑蜈蚣叶属Phaeophyscia分属观点ꎬ在此基础上将蜈蚣衣属中地衣体上皮层K-ꎬ不含atranorinꎬ下表面为淡白色ꎬ下皮层为假厚壁长细胞组织的几个种组建了新属PhyciellaEssl.ꎬ包括Physcielladenigrata㊁P.melanchra和P.nepalensis(Esslingerꎬ1978)ꎮ但是ꎬ其观点并没有被地衣学家们广泛接受ꎮ黑蜈蚣叶属地衣的主要特征为叶状地衣体ꎬ上皮层K-ꎬ不含atranorinꎬ髓层白色或橘红色ꎬ下皮层为假薄壁组织ꎬ个别为假厚壁长细胞组织ꎬ茶渍型子囊盘ꎬPhyscia型或Pachysporaria型子囊孢子ꎬ分生孢子近椭圆形且小于4μm长ꎮ该属地衣的生长基物多样ꎬ包括树皮㊁枯木㊁苔藓㊁岩石㊁土壤(Mobergꎬ1977ꎻAptroot&Sipmanꎬ1991ꎻLiu&Hurꎬ2019)ꎮ该属地衣的整体分布格局具有明显的北温带性质ꎬ分布或主要分布于北温带或北方植被带ꎬ东亚和北美洲是该属地衣两个重要的分布区域(陈健斌ꎬ2023)ꎮ本研究对保存于聊城大学生命科学学院地衣标本馆(LCUF)的地衣标本进行整理和鉴定时ꎬ发现了黑蜈蚣叶属地衣1新种ꎬ现予以报道ꎮ1㊀材料与方法1.1研究标本采自山东泰山的地衣标本ꎬ现保存于聊城大学生命科学学院地衣标本馆(LCUF)ꎮ1.2形态特征观察在OLYMPUSSZX16体式显微镜下观察地衣体的外表特征ꎬ并拍照ꎮ徒手纵切子囊盘ꎬ选其薄片置于配备有OLYMPUSDP74数字相机的OLYMPUSBX53光学显微镜下进行观察解剖特征ꎬ并拍照ꎮ1.3化学物质检测使用试剂K(10%氢氧化钾水溶液)㊁C(次氯酸钠饱和水溶液)和P(对苯二胺在95%乙醇中的饱和溶液)滴加在地衣体皮层或髓层上进行颜色反应(CT)ꎬ并综合薄层层析法(TLC)判断地衣所含次级代谢产物ꎬ所用溶剂为C系统(甲苯ʒ乙酸=20ʒ3ꎬ比值为体积比)(Culberson&Kristinssonꎬ1970ꎻCulbersonꎬ1972ꎻOrangeetal.ꎬ2001)ꎮ使用浓度为0.3%~1.0%的Lugol s溶液对子囊盘纵切薄片进行染色ꎬ观察子囊孢子淀粉样蛋白反应ꎮ1.4基因组提取、PCR扩增及测序从标本中选取适量地衣体ꎬ使用Sigma ̄AldrichREDExtract ̄N ̄AmpTM试剂盒ꎬ参照产品说明书进行地衣型真菌总基因组的提取ꎮ使用引物ITS1F和ITS4(Gardes&Brunsꎬ1993ꎻWhiteetal.ꎬ1990)扩增内源转录间隔区(ITS)片段ꎬ采用Zhao和Jia(2022)的PCR反应体系和反应条件进行扩增ꎬ使用1%琼脂糖凝胶电泳检测PCR扩增产物ꎬ送由铂尚生物技术有限公司(济南)进行测序ꎮ1.5序列比对和系统发育分析测序返回序列使用软件Geneiousv.9.0.2(BiomattersLtd.ꎬAucklandꎬNZ)进行拼接ꎬ并将序列上传至GenBank(OR769731)ꎮ自测序列与从GenBank中下载的37条序列ꎬ如表1所示ꎬ使用MAFFTv.7(Katohetal.ꎬ2009)进行多重比对(使用 L ̄ING ̄i 运算法则ꎬ其他参数为默认值)ꎮ使用GblocksV0.19b(Castresanaꎬ2000ꎻTalavera&Castresanaꎬ2007)对矩阵中首尾及中间的模糊序列进行消除ꎮ使用PhyloSuitev.1.2.2(Zhangetal.ꎬ2020)进行系统发育分析ꎬ利用ModelFinder(Kalyaanamoorthyetal.ꎬ2017)的AIC准则分别为最大似然法(ML)分析和贝叶斯法(BI)分析选择最优模型ꎬML分析的最适模型为TIM2e+R2ꎬBI分析的最适模型为SYM+I+Gꎮ在TIM2e+R2模型下ꎬ使用IQ ̄TREE(Nguyenetal.ꎬ2015)进行5000次ultrafast(Minhetal.ꎬ2013)ꎬ以及Shimodaira ̄Hasegawa ̄like检验(Guindonetal.ꎬ2010)构建ML树ꎻ在SYM+I+G模型下ꎬ使用MrBayesV.3.2.6226广㊀西㊀植㊀物44卷表1㊀系统发育所用的物种及序列信息Table1㊀Speciesandsequenceinformationusedforphylogeneticanalysis物种Species标本号VoucherNo.采集地LocalityGenBank序列登记号GenBankaccessionNo.颗粒芽黑蜈蚣叶Phaeophysciaadiastola中国ChinaAY498670P.cernohorskyiVAL_Lich32599西班牙SpainON831578睫毛黑蜈蚣叶P.ciliataChen&Hu21851中国ChinaAY498676睫毛黑蜈蚣叶P.ciliataTehler7892bAY498675P.constipata瑞典SwedenAF224374白腹黑蜈蚣叶P.denigrata14-0109中国ChinaMN103153白腹黑蜈蚣叶P.denigrataHan2021093005-1中国ChinaOM065431裂芽黑蜈蚣叶P.exornatula 中国ChinaAY498668裂芽黑蜈蚣叶P.exornatula 中国ChinaAY498669P.hirsutaLeavitt19089美国USAMZ922172P.hirsutaLeavitt19094美国USAMZ922171皮层毛黑蜈蚣叶P.hirtella中国ChinaAY498659皮层毛黑蜈蚣叶P.hirtella17-0256中国ChinaMN103154白刺毛黑蜈蚣叶P.hirtuosa 中国ChinaAY498662白刺毛黑蜈蚣叶P.hirtuosaD4_PYPE1英国UKKU862992毛边黑蜈蚣叶P.hispidulaHP ̄20L印度IndiaOK577906毛边黑蜈蚣叶P.hispidula 中国ChinaAY498673P.imbricata 中国ChinaAY498661P.kashmirensisLAH37160巴基斯坦PakistanON640614P.kashmirensisLAH37161巴基斯坦PakistanON640615P.limbataYO6846日本JapanLC669665P.limbataYO6842日本JapanLC669664P.microsporaLAH37623巴基斯坦PakistanOQ024192P.microsporaLAH37622巴基斯坦PakistanOQ024193P.orbicularisVondrak24003捷克共和国CzechRepublicOQ718018P.orbicularisMP49瑞典SwedenKX512876刺黑蜈蚣叶P.primaria 中国ChinaAY498663刺黑蜈蚣叶P.primaria 中国ChinaAY498660P.pusilloidesPalice30896捷克共和国CzechRepublicOQ717560P.pusilloidesVondrak26103捷克共和国CzechRepublicOQ717563火红黑蜈蚣叶P.pyrrhophoraHur060573韩国KoreaEU670228美丽黑蜈蚣叶P.rubropulchra141271韩国KoreaMN150493P.spinellosaFL ̄41438日本JapanLC547498泰山黑蜈蚣叶P.taishanensisTS18074中国ChinaOR769731载毛黑蜈蚣叶P.trichophoraHur041524韩国KoreaEU670216载毛黑蜈蚣叶P.trichophoraHur050006韩国KoreaEU670218PhysciellamelanchraYO6835日本JapanLC669676P.melanchraYO6819日本JapanLC669674㊀注:本研究自测序列加粗表示ꎮ㊀Note:Thenewsequencesgeneratedinthisstudyareindicatedinboldface.3264期蒋树浩等:黑蜈蚣叶属(蜈蚣衣科)地衣一新种(Ronquistetal.ꎬ2012)运行两次并行的马尔科夫链(MCMC)ꎬ每条链200万代ꎬ舍弃最初25%的样本数构建BI树ꎮ使用Figtreev.1.4.4进行系统发育树的查看和调整ꎮ2㊀结果与分析2.1系统发育分析本研究系统发育分析所用序列来源于自测序列BLAST结果以及相关文献(Fayyazetal.ꎬ2022ꎻNiazietal.ꎬ2023)ꎬ以Physciellamelanchra为外类群ꎬ共包括ITS序列38条(表1)ꎮ基于ITS序列进行系统发育分析ꎬ结果显示ML树和BI树拓扑结构一致ꎬ文中仅展示ML系统发育树ꎬML系统发育树图见图1ꎬ同时将ML树和BI树的后验概率值及自检举值标注在每一个分支上ꎮ系统发育结果显示ꎬ泰山黑蜈蚣叶(Phaeophysciataishanensis)与白腹黑蜈蚣叶(P.denigrata)聚在了一支ꎬ支持率为89%ꎬ形成姐妹群ꎬ说明这两个种有着较近的亲缘关系ꎻP.microspora与P.kashmirensi聚在了一支ꎬ支持率为92%ꎬBI后验概率为1ꎬ形成姐妹群ꎬ与Niazi等(2023)的结果一致ꎻ泰山黑蜈蚣叶和白腹黑蜈蚣叶所在分支与P.microspora和P.kashmirensis所在分支形成姐妹分支ꎬ支持率为89%ꎮ2.2分类单元PhaeophysciataishanensisSh.H.Jiang&Z.F.Jiasp.nov.Fig.2Fungalnames:FN571697Diagnosis:ThisnewspeciesisdistinctlyseparatefromthecomparablespeciesPhaeophysciadenigratainthattheupperportionofthethallinemarginoftheapotheciaoccasionallyhavesparsecorticalhairsꎬandthelowercortexisparaplectenchymatousꎬascosporesareonlyPhyscia ̄type.Etymology:Thespecificepithet taishanensis referstothetypelocalityofMountTaiꎬShandongProvinceꎬChina.Type:ChinaꎬShandongꎬTai anCityꎬMountTaiꎬBuyunBridgeꎬ36ʎ14ᶄ51ᵡNꎬ117ʎ06ᶄ23ᵡEꎬ940malt.ꎬonthebarkofUlmuspumilaL.ꎬ8November2020ꎬM.L.ZhuTS18074(holotypeꎬLCUFꎬGenBankOR769731).Description:Thallusfolioseꎬnearlyorbicularorirregularꎬmorethan7cmindiameterꎬcloselyadnatetothesubstratumꎻlobesdichotomouslytoirregularlybranchedꎬseparateꎬsometimesimbricateꎬ0.6-1.1mmwideꎬterminallyobtuseꎻthallus187.8-273.0μmthickꎻuppercortexgrey ̄greentoolive ̄greenꎬflatoroftenslightlyconcaveꎬoccasionallyhavewhiteorhyalinecorticalhairsontheuppersurfaceofmarginalperipheralzonesofthelobesꎬwhichsometimescanbesparseꎬlackingmaculationꎬsorediaꎬisidiaꎬorlobulesꎻuppercortex26.1-39.7μmthickꎻalgallayercontinuousꎬ53.3-85.8μmthickꎻmedullalooseꎬwhiteꎬ70.3-109.5μmthickꎻlowersurfaceblackꎬsometimeswhiteorpalebrownonthelobeendsꎬrhizinateꎻrhizinesdenseꎬblackꎬtheendsaresometimeswhiteꎬabout0.5mmlongꎻlowercortexparaplectenchymatousꎬ28.6-38.4μmthick.Apotheciacommonꎬsessileꎬusually0.5-1.5mmindiameterꎻdiscred ̄browntoblackꎬepruinoseꎻmarginentireꎻtheupperportionofthethallinemarginoftheapotheciaoccasionallyhavesparseandcountablecorticalhairsꎬusuallyfoundintheimmatureapotheciaꎬmostoftheapotheciumdonothavecorticalhairsꎻepitheciumbrownꎬ10.7-13.3μmthickꎻhymeniumhyalineorslightlybrownꎬ80.5-93.6μmthickꎻhypotheciumlightbrownꎬ26.5-30.3μmthickꎻasciclavateꎬeight ̄sporedꎻascosporesbrownꎬPhyscia ̄typeꎬ(18-20.5)μmˑ(9.0-10.0)μmꎬI+blueꎻpycnidiacommonꎬimmersedintothallusꎬbrowntoblackꎻconidiaellipsoidꎬ(2.6-3.3)μmˑ(0.9-1.7)μm.Chemistry:ThallusK-ꎻmedullaK-ꎻnosubstancesweredetectedbyTLC.特征提要:该新种与白腹黑蜈蚣叶相似ꎬ区别在于该新种盘托上部偶有白色或浅色的皮层毛ꎬ下皮层组织为假薄壁组织ꎬ子囊孢子仅为Physcia型ꎮ词源:种加词 taishanensis 表示该物种被发现的产地山东泰山ꎮ主模式:山东泰安市ꎬ泰山ꎬ步云桥ꎬ117ʎ06ᶄ23ᵡE㊁36ʎ14ᶄ51ᵡNꎬ海拔940mꎬ2020-11-08ꎬ朱孟丽TS18074ꎮ426广㊀西㊀植㊀物44卷每个分支的数值表示贝叶斯后验概率(PP)和自展值(BS)ꎬ仅显示自展值大于75或后验率大于0.95的数值ꎮ新物种和新生成的序列用粗体表示ꎮThenumberineachbranchrepresentsposteriorprobability(PP)andbootstrapsupport(BS)values.PPvalues>0.95andBSvalues>75areplottedonthebranches.Thenewspeciesandnewlygeneratedsequencesareinbold.图1㊀基于ITS序列构建的最大似然系统发育树Fig.1㊀MaximumlikelihoodtreeillustratingthephylogenybasedITSsequences㊀㊀地衣体叶状ꎬ近圆形或不规则状ꎬ直径大于7cmꎬ较紧密地贴生于基物ꎻ裂片二叉至不规则分裂ꎬ分离ꎬ或有时重叠ꎬ0.6~1.1mm宽ꎬ末端常钝圆ꎻ地衣体厚187.8~273.0μmꎻ上表面灰绿色至橄榄褐色ꎬ平坦或常常稍凹ꎬ末端具稀疏的皮层毛ꎬ无白斑㊁粉芽㊁裂芽和小裂片ꎻ上皮层厚26.1~39.7μmꎻ藻层厚53.3~85.8μmꎻ髓层疏松ꎬ白色ꎬ厚70.3~109.5μmꎻ下表面黑色ꎬ裂片末端处呈灰白色或浅褐色ꎬ具假根ꎻ假根单一不分枝ꎬ黑色ꎬ末端有时呈白色ꎬ约0.5mm长ꎻ下皮层厚28.6~38.4μmꎬ皮层组织为假薄壁组织ꎮ子囊盘常见ꎬ贴生ꎬ直径通常0.5~1.5mmꎻ盘面红褐色至黑色ꎬ无粉霜ꎻ盘缘完整ꎻ盘托上部偶有白色或浅色的皮层毛ꎬ常常稀疏可数ꎬ见于未成熟子囊盘ꎬ大部分子囊盘不具皮层毛ꎻ囊层被褐色ꎬ10.7~13.3μmꎻ子实层清晰状ꎬ稍带褐色ꎬ80.5~93.6μmꎻ囊层基清晰状ꎬ浅褐色ꎬ26.5~30.3μmꎻ子囊内含有8个孢子ꎻ子囊孢子褐色ꎬ厚壁ꎬPhyscia型ꎬ为(18~20.5)μmˑ(9.0~10.0)μmꎬI+ꎬ蓝色ꎻ分生孢子器常见ꎬ埋生于地衣体中ꎬ孔口凸起于地衣体上表面ꎬ棕色至黑色ꎬ圆点状ꎻ分生孢子椭圆形ꎬ(2.6~3.3)μmˑ(0.9~1.7)μmꎮ5264期蒋树浩等:黑蜈蚣叶属(蜈蚣衣科)地衣一新种A.地衣体和子囊盘ꎻB.裂片ꎻC.末端皮层毛㊁分生孢子器和假根ꎻD.盘托上部白色刺毛ꎻE.子囊盘纵切ꎻF.子囊盘纵切(偏光镜下)ꎻG-I.子囊ꎻJ.分生孢子ꎻK-O.子囊孢子ꎮ比例尺:AꎬB=2mmꎻC=0.5mmꎻD=1mmꎻEꎬF=0.5mmꎻG-I=20μmꎻJ=5μmꎻK-O=10μmꎮA.HabitofthallusꎻB.LobesꎻC.WhiteorhyalinecorticalhairsontheuppersurfaceofthemarginalperipheralzonesofthelobesꎬpycnidiaandrhizinesꎻD.TheupperportionofthethallinemarginoftheapotheciaoccasionallyhavesparsecorticalhairsꎻE.ApotheciasectionꎻF.Apotheciasection(inpolarizedlight)ꎻG-I.AsciꎻJ.ConidiaꎻK-O.Ascospore.Scalebars:AꎬB=2mmꎻC=0.5mmꎻD=1mmꎻEꎬF=0.5mmꎻG-I=20μmꎻJ=5μmꎻK-O=10μm.图2㊀泰山黑蜈蚣叶(M.L.ZhuTS18074ꎬLCUF)Fig.2㊀Phaeophysciataishanensis(M.L.ZhuTS18074ꎬLCUF)626广㊀西㊀植㊀物44卷㊀㊀化学反应:地衣体K-ꎻ髓层K-ꎻTLC未检测出地衣化学物质ꎮ分布:该种产自中国东部山东省中部ꎬ该地区地带性森林类型为落叶阔叶林ꎬ气候为温带季风气候ꎬ为北温带成分ꎬ其生长基物为榆树(UlmuspumilaL.)树皮ꎮ截至目前ꎬ该种仅在标本模式产地发现ꎮ其他研究标本:山东泰安市ꎬ泰山ꎬ步云桥ꎬ117ʎ06ᶄ23ᵡE㊁36ʎ14ᶄ51ᵡNꎬ海拔940mꎬ2020-11-08ꎬ朱孟丽TS18071㊁TS18072㊁TS18073ꎮ3㊀讨论本种的主要特征是地衣体上表面末端具稀疏的皮层毛ꎬ髓层白色ꎬ下表面黑色ꎬ裂片末端处呈灰白色或浅褐色ꎬ盘托上部偶有白色或浅色的皮层毛ꎬ常常稀疏可数ꎬ子囊孢子褐色ꎬ厚壁ꎬPhyscia型ꎬ(18~20.5)μmˑ(9.0~10.0)μmꎮ在形态及化学上ꎬ本种与皮层毛黑蜈蚣叶(Phaeophysciahirtella)㊁白刺毛黑蜈蚣叶(P.hirtuosa)和P.esslingeri相似ꎮ本种与P.hirtella和P.hirtuosa相比ꎬ后两者子囊盘基部都常具有黑色的假根ꎬ而本种子囊盘基部无假根ꎮ与P.esslingeri相比ꎬ后者地衣体上表面有白斑ꎬ盘托上部皮层毛较多ꎬ孢子较宽ꎬ为[(17~)18~25]μmˑ[10~12(~14)]μm(Kondratyuketal.ꎬ2016)ꎻ但本种地衣体上表面无白斑ꎬ盘托上部偶有白色或浅色的皮层毛ꎬ常常稀疏可数ꎬ孢子较窄ꎮ在系统发育上ꎬ本种亲缘关系与白腹黑蜈蚣叶(Phaeophysciadenigrata)㊁P.microspora和P.kashmirensis相近ꎮ本种与P.denigrata相比ꎬ后者地衣体下表面灰白色ꎬ盘托上部不具皮层毛ꎬ子囊孢子为Pachysporaria型或Physcia型ꎻ而本种地衣体下表面黑色ꎬ裂片末端处呈灰白色或浅褐色ꎬ果托上部偶有白色或浅色的皮层毛ꎬ子囊孢子仅为Physcia型ꎻP.denigrata曾置于PhyciellaEssl.中ꎬ下表面灰白色ꎬ皮层组织是假厚壁长细胞ꎬ通过对本种裂片进行横切㊁纵切观察发现ꎬ本种下表面皮层组织为假薄壁组织ꎬ对于搭建Physciella与Phaoephyscia之间 桥梁 关系具有重要意义ꎬ仍需进一步研究ꎮ与P.microspora相比ꎬ后者子囊盘基部有黑色假根ꎬ孢子较小ꎬ为(14~17)μmˑ(6.0~8.0)μmꎬ未见分生孢子器(Schumm&Aptrootꎬ2019)ꎻ而本种子囊盘基部没有假根ꎬ孢子较大ꎬ分生孢子器可见ꎮ与P.kashmirensis相比ꎬ后者地衣体边缘具有大量的粉芽堆(Fayyazetal.ꎬ2022)ꎬ未见分生孢子器ꎻ而本种无粉芽堆ꎬ分生孢子器可见ꎮ致谢㊀感谢中国科学院微生物研究所陈健斌研究员在标本鉴定方面以及本文内容提供宝贵建议ꎬ感谢本课题组硕士生朱孟丽协助采集标本!参考文献:APTROOTAꎬSIPMANHJMꎬ1991.NewlichensandlichenrecordsfromNewGuinea[J].Willdenowiaꎬ20:221-256.CASTRESANAJꎬ2000.Selectionofconservedblocksfrommultiplealignmentsfortheiruseinphylogeneticanalysis[J].MolBiolEvolꎬ17(4):540-552.CHENJBꎬHUGRꎬ2022.ThelichenfamilyPhysciaceae(Ascomycota)inChinaⅦ.FivespeciesnewtoChina[J].Mycosystemaꎬ41(1):155-159.[陈健斌ꎬ胡光荣ꎬ2022.中国蜈蚣衣科地衣Ⅶ.五个新记录种[J].菌物学报ꎬ41(1):155-159.]CHENJBꎬ2023.FloralichenumSinicorum.Physciaceae:Vol.20[M].Beijing:SciencePress:1-262.[陈健斌ꎬ2023.中国地衣志.蜈蚣衣科:第20卷[M].北京:科学出版社:1-262.]CULBERSONCFꎬKRISTINSSONHDꎬ1970.Astandardizedmethodfortheidentificationoflichenproducts[J].JChromatogrAꎬ46:85-93.CULBERSONCFꎬ1972.Improvedconditionsandnewdataforidentificationoflichenproductsbystandardizedthin ̄layerchromatographicmethod[J].JChromatogrAꎬ72(1):113-125.ESSLINGERTꎬ1978.StudiesinthelichenfamilyPhysciaceae.Ⅲ.AnewspeciesofPhaeophysciafromHawaii[J].Mycologiaꎬ70:1247-1249.FAYYAZIꎬAFSHANNSꎬKHALIDANꎬ2022.Phaeophysciakashmirensissp.nov.(LecanoralesꎬPhysciaceae)fromAzadJammuandKashmirꎬPakistan[J].Lichenologistꎬ54(6):355-361.GARDESMꎬBRUNSTDꎬ1993.ITSprimerswithenhancedspecificityforbasidiomycetes-applicationtotheidentificationofmycorrhizaeandrusts[J].MolEcolꎬ2(2):113-118.GUINDONSꎬDUFAYARDJFꎬLEFORTVꎬetal.ꎬ2010.Newalgorithmsandmethodstoestimatemaximum ̄likelihoodphylogenies:assessingtheperformanceofPhyML3.0[J].SystBiolꎬ59(3):307-321.KALYAANAMOORTHYSꎬMINHBQꎬWONGTKFꎬetal.ꎬ2017.ModelFinder:fastmodelselectionforaccuratephylogeneticestimates[J].NatMethodꎬ14(6):587-589.7264期蒋树浩等:黑蜈蚣叶属(蜈蚣衣科)地衣一新种KATOHKꎬASIMENOSGꎬTOHHꎬ2009.MultiplealignmentofDNAsequenceswithMAFFT[J].MethodMolBiol(CliftonꎬN.J.)ꎬ537:39-64KONDRATYUKSYꎬLÖKÖSLꎬFARKASEꎬetal.ꎬ2016.Phaeophysciaesslingerisp.nov.(Physciaceaeꎬlichen ̄formingAscomycota) anewlichenspeciesfromEasternAsiaꎬwithaworld ̄widekeytothehairyspeciesofthegenus[J].StudBotHungꎬ47(2):251-262.LIUDꎬHURJSꎬ2019.RevisionofthelichengenusPhaeophysciaandalliedatranorinabsenttaxa(Physciaceae)inSouthKorea[J].Microorganismsꎬ7(8):242.MINHBQꎬNGUYENMATꎬVONHAESELERAꎬ2013.Ultrafastapproximationforphylogeneticbootstrap[J].MolBiolEvolꎬ30(5):1188-1195.MOBERGRꎬ1977.ThelichengenusPhysciaandalliedgenerainFennoscandia[J].SymbolaeBotUpsaliensesꎬ22:1-108.NGUYENLTꎬSCHMIDTHAꎬVONHAESELERAꎬetal.ꎬ2015.IQ ̄TREE:afastandeffectivestochasticalgorithmforestimatingmaximum ̄likelihoodphylogenies[J].MolBiolEvolꎬ32(1):268-274.NIAZIARꎬAFSHANNSꎬNASEERAꎬetal.ꎬ2023.AnewspeciesandanewrecordofthegenusPhaeophysciaMoberg(LecanoralesꎬPhysciaceae)fromPakistansupportedbyphenotypicandmolecularphylogeneticanalyses[J].CryptogMycolꎬ44(4):51-59.ORANGEAꎬJAMESPWꎬWHITEFJꎬ2001.Microchemicalmethodsfortheidentificationoflichens[M].London:BritishLichenSociety:1-101.RONQUISTFꎬTESLENKOMꎬVANDERMARKPꎬetal.ꎬ2012.MrBayes3.2:efficientbayesianphylogeneticinferenceandmodelchoiceacrossalargemodelspace[J].SystBiolꎬ61(3):539-542.SCHUMMFꎬAPTROOTAꎬ2019.VirtuellesHerbariumderFlechtengattungenHyperphysciaꎬPhaeophysciaꎬPhysciaundPhysconia[M].Norderstedt:BooksonDemand:1-632.TALAVERAGꎬCASTRESANAJꎬ2007.Improvementofphylogeniesafterremovingdivergentandambiguouslyalignedblocksfromproteinsequencealignments[J].SystBiolꎬ56(4):564-577.WEIJCꎬ2020.TheenumerationoflichenizedfungiinChina[M].Beijing:ChinaForestryPublishingHouse:1-606. [魏江春ꎬ2020.中国地衣型真菌综览[M].北京:中国林业出版社:1-606.]WHITETJꎬBRUNSTꎬLEESꎬetal.ꎬ1990.AmplificationanddirectsequencingoffungalribosomalRNAgenesforphylogenetics[M]//INNISMAꎬGELFANDDHꎬSNINSKYJJꎬetal.PCRProtocols.SanDiego:AcademicPress:315-322.WIJAYAWARDENENNꎬHYDEKDꎬDAIDQꎬetal.ꎬ2022.Outlineoffungiandfungus ̄liketaxa-2021[J].Mycosphereꎬ13(1):53-453.ZHANGDꎬGAOFꎬJAKOVLIC'Iꎬetal.ꎬ2020.PhyloSuite:Anintegratedandscalabledesktopplatformforstreamlinedmolecularsequencedatamanagementandevolutionaryphylogeneticsstudies[J].MolEcolResourcꎬ20(1):348-355.ZHAOYFꎬJIAZFꎬ2022.Astrotheliumsubsiamensesp.nov.fromFujianꎬChina[J].Mycotaxonꎬ137(3):477-484.(责任编辑㊀蒋巧媛㊀王登惠)826广㊀西㊀植㊀物44卷。
多源特征融合选择

1.特征之间的相关性会导致信息冗余和过拟合,需要采用有效的特征选择方法。 2.不同数据源的特征可能存在噪声和异常值,需要进行数据清洗和预处理。 3.高维度特征会带来维度灾难,需要采用降维技术或特征选择方法进行优化。
多源特征及其挑战
▪ 多源特征融合的方法
1.常见的多源特征融合方法包括加权融合、叠加融合和深度学习融合等。 2.加权融合是根据不同特征的重要程度进行加权,叠加融合则是将不同特征直接相 加或拼接。 3.深度学习融合可以自动学习不同特征之间的权重和关系,提高模型的性能。
多源特征融合选择
基于统计学的选择
基于统计学的选择
▪ 基于统计学的特征选择概述
1.特征选择的重要性:提高模型性能、降低过拟合、提升解释性。 2.基于统计学的特征选择基本原理:利用数据的统计性质进行特征评估。
▪ 单变量统计检验
1.基于单变量统计检验的特征选择方法:卡方检验、t检验、F检验等。 2.方法原理:通过比较每个特征与目标变量的关联性,进行特征排序和选择。
特征融合选择实例
▪ 语音识别中的特征融合选择实例
1.在语音识别任务中,通过将声学特征和语言模型特征进行融合,可以提高语音识 别的准确率。 2.实例中采用了深度神经网络模型,将声学特征和语言模型特征进行融合,取得了 优于单一特征的识别效果。 3.特征融合选择技术可以充分利用不同特征的互补信息,提高语音识别的性能和鲁 棒性。
▪ 基于深度学习的特征选择的评估和优化
1.评估基于深度学习的特征选择方法的效果需要适当的评估指 标和数据集,常用的评估指标包括准确率、召回率、F1分数等 。 2.优化基于深度学习的特征选择方法可以通过改进模型结构、 增加训练轮数、调整超参数等方式进行。
山东大学学报(工学版)总目次

第6期第50卷总目次山东大学学报(工学版)第50卷2020 年总目次机器学习与数据挖掘基于域对抗网络和B E R T 的跨领域文本情感分析...............基于V i B e 算法运动特征的关键帧提取算法......................自适应属性选择的实体对齐方法.............................基于门控循环单元与主动学习的协同过滤推荐算法...........基于异质集成学习的虚假评论检测..........................一种使用并行交错采样进行超分辨的方法....................基于校正神经网络的视频追踪算法...........................基于改进Y O L O v 3的复杂场景车辆分类与跟踪..................基于混合决策的改进鸟群算法..............................一种基于深度神经网络的句法要素识别方法..................基于多维相似度和情感词扩充的相同产品特征识别...........符号序列的L D A 主题特征表示方法 .........................基于元图归一化相似性度量的实体推荐.......................基于Laplacian 支持向量机和序列信息的m i c r o R N A -结合残基预测 基于三维剪切波变换和B M 4D 的图像去噪方法................................蔡国永,林强,任凯琪(1-1)……李秋玲,邵宝民,赵磊,王振,姜雪(1-8)……苏佳林,王元卓,靳小龙,程学旗(1-14)......陈德蕾,王成,陈建伟,吴以茵(1-21)…张大鹏,刘雅军,张伟,沈芬,杨建盛(2-1)........................朱安,徐初(2-10)...........陈宁宁,赵建伟,周正华(2-17).............宋士奇,朴燕,蒋泽新(2-27)闫威,张达敏,张绘娟,辛梓芸,陈忠云(2-34)......陈艳平,冯丽,秦永彬,黄瑞章(2-44)...................胡龙茂,胡学钢(2-50).............冯超,徐鲲鹏,陈黎飞(2-60).............张文凯,禹可,吴晓非(2-66).....................马昕,王雪(2-76)......张胜男,王雷,常春红,郝本利(2-83)基于预测数据特征的空气质量预测方法...................................................................................................高铭壑,张莹,张蓉蓉,黄子豪,黄琳焱,李繁菀,张昕,王彦浩(2-91)基于轻型卷积神经网络的火焰检测方法..........................严云洋,杜晨锡,刘以安,高尚兵(2-100)基于深度学习的洗衣机异常音检测..........................李春阳,李楠,冯涛,王朱贺,马靖凯(2-108)语义分析及向量化大数据跨站脚本攻击智检.....................................张海军,陈映辉(2-118)自然语言问答中的语义关系识别.....................一种Chirplet 神经网络自动目标识别算法..............基于G a b o r 特征的乳腺肿瘤M R 图像分类识别模型......基于U A R T 串口的多机通讯.............................基于多模态子空间学习的语义标签生成方法.........基于背景复杂度自适应距离阈值修正的S u B S E N S E 算法基于双重启发式信息求解影响最大化问题的蚁群算法…联合检测的自适应融合目标跟踪.....................基于核极限学习机自编码器的标记分布学习.........基于集成学习〇,的质量浓度预测模型................基于空间注意力和卷积神经网络的视觉情感分析..............................段江丽,胡新(3-1)......................李怡霏,郭尊华(3-8).........袁高腾,刘毅慧,黄伟,胡兵(3-15).............................马金平(3-24)田楓,李欣,刘芳,李闯,孙小强,杜睿山(3-31)...............成科扬,孙爽,詹永照(3-38)•…覃俊,李蔚栋,易金莉,刘晶,马懋德(3-45)...............刘保成,朴燕,宋雪梅(3-51).......王一宾,李田力,程玉胜,钱坤(3-58)..................彭岩,冯婷婷,王洁(4-1)............蔡国永,贺歆灏,储阳阳(4-8)• 2 ■山东大学学报(工学版)第50卷一种基于多目标的容器云任务调度算法...............基于卷积神经网络的深度线段分类算法................基于类激活映射-注意力机制的图像描述方法...........基于Bi -LSTM 的脑电情绪识别.........................带特征指标约束描述的设计模式分类挖掘..............基于NRC 和多模态残差神经网络的肺部肿瘤良恶性分类中文对话理解中基于预训练的意图分类和槽填充联合模型融合残差块注意力机制和生成对抗网络的海马体分割••…........................谢晓兰,王琦(4-14)..............赵宁宁,唐雪嵩,赵鸣博(4-22).....廖南星,周世斌,张国鹏,程德强(4-28)..................刘帅,王磊,丁旭涛(4-35).....肖卓宇,何锫,陈果,徐运标,郭杰(6-48)■•…霍兵强,周涛,陆惠玲,董雅丽,刘珊(6-59)........................马常霞,张晨(6-68)张月芳,邓红霞,呼春香,钱冠宇,李海芳(6-76)控制科学与工程基于空间隐患分布与运动意图解析的危险评估方法........一类非仿射非线性大系统的结构在线扩展.................GPRS 监管的多协议异构现场总线控制系统................基于新型趋近律的参数未知分数阶Rucklidge 系统的滑模同步分数阶Brussel 系统混沌同步的三种控制方案...............一类非线性混沌系统的自适应滑模同步...................含对数项分数阶T 混沌系统的滑模同步...................赵越男,陈桂友,孙琛,卢宁,譽立伟(1 -28)............曹小洁,李小华,刘辉(1-35)……侯鹏飞,孙竹梅,王琦,白建云(1-49).........王春彦,邸金红,毛北行(4-40).........................程春蕊(4-46)..................程春蕊,毛北行(5-1)..................孟晓玲,毛北行(5-7)土木工程含层状节理岩体力学性质数值模拟研究.......................................徐子瑶,虞松,付强(3-66)水泥土搅拌桩沿海软基处理..............................................吕国仁,葛建东,肖海涛(3-73)高地应力下砂岩力学参数和波速变化规律试验研究..............................宫嘉辰,陈士海(3-82)饱和地基中单排孔近场隔振的现场试验与数值分析智慧公路关键技术发展综述...................双节理岩体T B M 滚刀破岩过程数值模拟......基于熵值法的水利施工企业绩效考核K P I 设计方法偏压大跨小净距公路隧道施工力学行为..........基于B P 神经网络算法的结构振动模态模糊控制••砂土介质中颗粒浆液扩散距离变化规律........预应力中空棒构件设计与力学特性..............隐伏溶洞对隧道围岩稳定性影响规律及处治技术硬岩隧道纯钢纤维混凝土管片应用..............喷扩锥台压灌桩最优构造.......................松散地层隧道进洞段管棚注浆加固效应分析……孙连勇,时刚,崔新壮,周明祥,王永军,纪方,闫小东(3-88)................................吴建清,宋修广(4-52)施雪松,管清正,王文扬,许振浩,林鹏,王孝特,刘洁(4-70).........................................程森(4-80)........................................王春国(4-85)...........................王志伟,葛楠,李春伟(5-13)........................冯啸,夏冲,王凤刚,张兵(5-20).............................林超,张程林,王勇(5-26).....................陈禹成,王朝阳,郭明,林鹏(5-33)..............徐振,李德明,王彬,詹谷益,张世杰(5-44)...........李连祥,邢宏侠,李金良,黄亨利,王雷(6-82)...................余俊,翁贤杰,樊文胜,张连震(6-92)机械与能动工程柔性Rushton 桨的振动特性.........................................................刘欣,杨锋茶(5-50)湿法脱硫塔一维传热传质性能模型理论与试验.....................陈保奎,孙奉仲,高明,史月涛(5-56)波浪能发电装置浮体形状参数对俘能性能影响............刘延俊,王伟,陈志,王冬海,王登帅,薛钢(6-1)深拖地震线列阵的动力学建模与位置预报...................朱向前,魏峥嵘,裴彦良,于凯本,宗乐(6-9)淹没深度对三自由度波能浮子获能的影响........................黄淑亭,翟晓宇,刘延俊,史宏达(6-17)尾缘襟翼振荡水翼的水动力特性.................................孙光,王勇,谢玉东,陈晨,张玉兵(6-23)深海带电插拔连接器力学特性分析…韩家桢,王勇,谢玉东,王启先,张新标,高文彬,李荣兰,张传军(6-30) 振荡翼改进运动模型的能量捕获性能分析............................乔凯,王启先,王勇,谢玉东(6-40)第6期第50卷总目次电气工程能源消费发展及预测方法综述..............................杨明,杜萍静,刘凤全,郝旭鹏,孛一凡(1-56)基于物理不可克隆函数的电网NB-IoT端到端安全加密方案............................................................................................刘冬兰,刘新,陈剑飞,王文婷,张昊,马雷,李冬(丨-63)中央空调紧急控制应对受端电网直流闭锁故障研究.................................................................................................刘萌,程定一,张文,张恒旭,李宽,张国辉,苏建军U-72)风电爬坡事件的非精确条件概率预测..........................王勃,汪步惟,杨明,赵元春,朱文立(丨-82)考虑同步调相机无功特性的多馈入直流同时换相失败风险评估方法............................................................................................麻常辉,王亮,谭邵卿,卢奕,马欢,赵康(3-98)考虑路灯充电桩接入的城市配电网电压控制方法............宋士瞻,陈浩宇,张健,王坤,郝庆水(3-104)基于分时电价的含光伏的智慧家庭能量调度方法…潘志远,刘超男,李宏伟,王婧,王威,刘静,郑鑫(3-111)基于弹性梯度下降算法的B P神经网络降雨径流预报模型..........金保明,卢光毅,王伟,杜伦阅(3-117)基于学习理论的含光储联合系统的输电网双层规划……孙东磊,赵龙,秦敬涛,韩学山,杨明,王明强(4-90) 考虑内部动态约束的MMC功率运行区间的确定及控制方法……张锋,杨桂兴,岳晨晶,郝全睿,李东(4 - 9 8)虾米腰弯管内置导流板优化...................................祁金胜,曹洪振,石岩,杜文静,王湛(5-64)基于B P神经网络的短期光伏集群功率区间预测........孙东磊,王艳,于一潇,韩学山,杨明,闰芳晴(5-70)偏心方圆节扩散管数值模拟.................................曹洪振,祁金胜,袁宝强,杜文静,王湛(5-77)烟气成分对湿式电除尘器电晕放电特性的影响.................王磊,张玉磊,李兆东,张金峰,王翔(5-83)含电极式电锅炉的地区电网电源侧综合效益分析......葛维春,李昭,赵东,李振宇,叶青,傅予,于娜(5-90)基于特征频带相电流提取的故障选相和选线方法........................张贺军,王鹏,徐凯,石访(5-99)电动汽车虚拟储能可用容量建模.......................................李蓓,赵松,谢志佳,牛萌(6-101)基于RTDS的配电网一二次融合仿真技术...............李志,余绍峰,苏毅方,王蔚,蒋宏图,张伟(6-112)芒刺参数对电晕放电及细颗粒物脱除特性的影响............................王磊,李明臻,王翔(6-118)含不凝气蒸汽在锯齿形表面的凝结传热特性............................闫吉庆,王效嘉,田茂诚(6-129)化学与环境济南城区大气PM2.5、PM,。
基于自适应特征选择的图像分类算法研究

基于自适应特征选择的图像分类算法研究图像分类是计算机视觉领域的一个重要研究方向,其目标是将图像分为不同的类别。
然而,由于图像数据的高维性和复杂性,如何选择有效的特征对于提高分类准确度至关重要。
因此,本文将研究一种基于自适应特征选择的图像分类算法。
首先,我们介绍自适应特征选择的概念和意义。
自适应特征选择是指根据数据集本身的特点和需求,在特定任务中选择最具代表性和区分度的特征子集。
与传统方法相比,自适应特征选择能够更好地适应不同类型和规模的数据集,并提高分类准确度。
接下来,我们将探讨基于自适应特征选择的图像分类算法中常用的方法和技术。
首先是基于信息增益或互信息准则进行特征选择。
这些方法通过计算每个特征与类别之间关联度来评估其重要性,并根据评估结果进行排序或筛选。
其次,在自适应特征选择中常用到降维技术,如主成分分析(PCA)或线性判别分析(LDA)。
这些技术能够将原始高维图像数据映射到低维空间,同时保留最重要的特征信息。
通过降低维度,可以减少计算复杂度,并提高分类准确度。
此外,基于稀疏表示的特征选择方法也被广泛应用于图像分类中。
稀疏表示是指将高维图像数据表示为少量基向量的线性组合,通过选择最相关的基向量来提取最具代表性的特征。
在算法实现方面,我们将重点介绍支持向量机(SVM)和深度学习方法。
SVM是一种常用的监督学习算法,在图像分类中取得了很好的效果。
我们将研究如何在基于自适应特征选择的图像分类算法中使用SVM,并探讨如何调整其参数以获得更好的性能。
深度学习是近年来兴起的一种强大机器学习方法,其在图像分类中表现出色。
我们将介绍卷积神经网络(CNN)和自编码器等深度学习模型,并讨论如何使用自适应特征选择来提高其性能。
此外,在实验部分,我们将使用公开数据集进行验证和评估。
通过比较不同方法在不同数据集上的表现,可以得出结论并验证基于自适应特征选择的图像分类算法的有效性和优势。
最后,我们总结本文的研究内容和成果,并展望未来的研究方向。
信息熵-特征选择方案

基于互信息的特征选择1. 模型定义D1 病集S 由有关心脏病病种i X (i =1,2,…,n )组成,令患者的疾病信息熵1-2为: )(1log)()(1i n i i X P X P X H ∑=-= (1)显然疾病信息熵具有Shannon 信息熵的性质,反映了临床中具体病人的客观信息及实际医疗干预过程中所表现的信息在总体特征上的平均不确定性.定义D2:一个诊断病例库可以表示为关于病例特征的矩阵形式n m ij x Casebase ⨯=][ (2) 其中,ij x —病例库中第j 个病例的第i 个属性值;m —病例特征数量;n —病例库规模;定义D3:一个信息系统(IS )可以表达为,,,r r f R I U R V f ∈=<> (3) 其中,U 是对象的非空有限集合, R 是属性的非空有限集合,r r R V V ∈=是属性值的集合,V r 表示了属性任意r R ∈时的属性值范围,:r f U R V ⨯→ 是一个信息函数,它指定U 中每一个对象 x 的属性值.当R 中的属性集可进一步分解为条件属性集合C 和决策属性集合D ,且满足,R C D C D =⋃ ⋂=∅时,信息系统(IS)称为决策系统(DS)3. a i 为某一条件属性,则决策属性D 对某一条件属性a i 的依赖程度可以利用下式计算4-5:1马笑潇, 黄席樾, 等. 基于信息熵的诊断过程认知信息流分析[J]. 重庆大学学报:自然科学版, 2002,25(5):25-28. 2 王园, 吉国力, 魏磊. 信息熵在临床定量诊断分析中的研究及应用[J]. 厦门大学学报:自然科学版,2004,43(B08):353-356.3 张文宇. 数据挖掘与粗糙集方法[M]. 西安电子科技大学出版社, 2007: 49.4 屈利, 苑津莎, 李丽. 基于事例推理的电力系统短期负荷预测[J]. 电力科学与工程, 2008,24(2):59-63.(4) 式中,R C 、R D 分别表示条件属性集合C 和策属性集合D 在论域上的等价关系.()D CR H R 表示R D 相对于R C 的条件熵.(,)i I a D 的值越大,则条件属性a i 对决策属性D 的重要性越大.如果(,)0i I a D ,则说明a i 对于D 不起作用,可以删除.在基于属性信息增益的约简方法中,计算案例库属性集的每个属性的信息增益,并约定属性的信息增益大于某个阈值时就将该属性归入最优属性子集,否则弃用属性.1.3 基于互信息的特征选择6:三种经典的基于互信息的特征选择算法,分别为信息增益、互信息和交叉熵,以及于互信息最大化的特征选择算法7。
基于类信息的文本聚类中特征选择算法

基于类信息的文本聚类中特征选择算法
严莉莉;张燕平
【期刊名称】《计算机工程与应用》
【年(卷),期】2007(43)12
【摘要】文本聚类属于无监督的学习方法,由于缺乏类信息还很难直接应用有监督的特征选择方法,因此提出了一种基于类信息的特征选择算法,此算法在密度聚类算法的聚类结果上使用信息增益特征选择法重新选择最有分类能力的特征,实验验证了算法的可行性和有效性.
【总页数】4页(P144-146,217)
【作者】严莉莉;张燕平
【作者单位】安徽大学,智能计算与信号处理重点实验室,合肥,230039;安徽大学,智能计算与信号处理重点实验室,合肥,230039
【正文语种】中文
【中图分类】TP39
【相关文献】
1.基于相对分类信息熵的进化特征选择算法 [J], 翟俊海;刘博;张素芳
2.基于DF算法改进的文本聚类特征选择算法 [J], 樊东辉;王治和;陈建华;许虎寅
3.基于MPGA的混合特征选择算法在驾驶压力检测中的应用 [J], 张傲;陈兰岚;魏琛
4.基于PSO混合特征选择算法在疲劳驾驶中的应用 [J], 林雨培;陈兰岚;邹俊忠
5.一种基于黏液菌觅食机制的特征选择算法及其在文本情感识别中的应用 [J], 徐济惠;颜晨阳
因版权原因,仅展示原文概要,查看原文内容请购买。
基于复合熵和证据理论的抗SSDF攻击协作频谱感知方法
第45卷 第11期2023年11月系统工程与电子技术SystemsEngineeringandElectronicsVol.45 No.11November2023文章编号:1001 506X(2023)11 3663 08 网址:www.sys ele.com收稿日期:20220714;修回日期:20221121;网络优先出版日期:20221228。
网络优先出版地址:https:∥kns.cnki.net/kcms/detail/11.2422.TN.20221228.1255.010.html基金项目:国家自然科学基金(62001139)资助课题 通讯作者.引用格式:苑申昊,陈增茂,刁鸣,等.基于复合熵和证据理论的抗SSDF攻击协作频谱感知方法[J].系统工程与电子技术,2023,45(11):3663 3670.犚犲犳犲狉犲狀犮犲犳狅狉犿犪狋:YUANSH,CHENZM,DIAOM,etal.CooperativespectrumsensingmethodagainstSSDFattacksbasedoncom positeentropyandevidencetheory[J].SystemsEngineeringandElectronics,2023,45(11):3663 3670.基于复合熵和证据理论的抗犛犛犇犉攻击协作频谱感知方法苑申昊1,陈增茂1,2, ,刁 鸣1,孙志国1,孙溶辰1(1.哈尔滨工程大学信息与通信工程学院,黑龙江哈尔滨150001;2.哈尔滨工程大学工业和信息化部先进船舶通信与信息技术重点实验室,黑龙江哈尔滨150001) 摘 要:针对协作频谱感知中,频谱感知数据篡改(spectrumsensingdatafalsification,SSDF)攻击导致的感知性能恶化问题,在次级用户中恶意用户占比小于一半的情况下,提出一种基于复合熵和证据理论的抗SSDF攻击协作频谱感知方法。
用户评论方面级情感分析研究
用户评论方面级情感分析研究陈虹,杨燕+,杜圣东西南交通大学信息科学与技术学院,成都611756+通信作者E-mail:***************.cn 摘要:方面级情感分析是自然语言处理的热门研究方向之一,相比于传统的情感分析技术,基于方面的情感分析是细粒度的,能够判断句子中多个目标的情感倾向,能更加准确地挖掘用户对目标的情感极性。
针对以往研究忽略目标单独建模的问题,提出了一种基于双向长短期记忆神经网络(BiLSTM )的交互注意力神经网络模型(Bi-IAN )。
该模型通过BiLSTM 对目标和上下文分别进行建模,获得目标和上下文的隐藏表示,提取其中的语义信息。
接下来利用交互注意模块学习上下文和目标之间的注意力,分别生成目标和上下文的表示,捕捉目标和上下文之内和之间的相关性,并重构评价对象和上下文的表示,最终通过非线性层得到分类结果。
在数据集SemEval 2014任务4和Chinese review datasets 上的实验训练显示,在正确率和F 1-score 上,比现有的基准情感分析模型有更好的效果。
关键词:方面级情感分析;深度学习;循环神经网络(RNN );注意力机制文献标志码:A中图分类号:TP391.1Research on Aspect-Level Sentiment Analysis of User ReviewsCHEN Hong,YANG Yan +,DU ShengdongSchool of Information Science and Technology,Southwest Jiaotong University,Chengdu 611756,ChinaAbstract:Aspect-based sentiment analysis has become one of the hot research directions of natural language pared with the traditional sentiment analysis technology,aspect-based sentiment analysis is aimed at specific targets in sentences,and can judge the sentiment tendency of multiple targets in a sentence,and more accurately mine the sentiment polarity of the target.It is a fine-grained sentiment analysis technology.Aiming at the fact that the previous research ignored the problem of separate modeling of targets,an interactive attention network model based on bidirectional long short-term memory (Bi-IAN)is proposed.The model uses bidirectional long short-term memory (BiLSTM)to model the targets and the context respectively,to obtain hidden representation and extract the semantic information.Next,the attention vector between the context and the targets is learnt through interactive learning,and then the representation of the target and the context are generated.The relevance within and between the target and the context is captured,the representation of the target and context is reconstructed,and finally the model gets the classification result through the non-linear layer.Experimental training on the dataset SemEval 2014task 4and Chinese review datasets shows that the model proposed has better results than the existing benchmark sentiment analysis model in terms of accuracy and F 1-score.Key words:aspect-level sentiment analysis;deep learning;recurrent neural network (RNN);attention mechanism计算机科学与探索1673-9418/2021/15(03)-0478-08doi:10.3778/j.issn.1673-9418.2007011基金项目:国家自然科学基金(61976247);国家科技支撑计划(2015BAH19F02)。
一种新的使用辨识集的属性约简算法
一种新的使用辨识集的属性约简算法
史岳鹏;朱颢东
【期刊名称】《微型机与应用》
【年(卷),期】2009(028)019
【摘要】为基于差别矩阵的属性约简算法求解时,先要求出差别矩阵,问题规模增大,将导致存放差别矩阵的空间过大和算法执行时间过长.针对这一问题,本文提出了辨识集的定义,并利用辨识集设计了新的属性约简算法,减少了存储量和计算量,提高了算法的效率.
【总页数】3页(P52-54)
【作者】史岳鹏;朱颢东
【作者单位】郑州牧业工程高等专科学校,信息工程系,河南,郑州,450011;中国科学院成都计算机应用研究所,四川,成都,610041;中国科学院研究生院,北京,100039【正文语种】中文
【中图分类】TP301
【相关文献】
1.粗糙集属性约简的一种新算法 [J], 李伟涛;刘琼荪
2.一种新的决策粗糙集启发式属性约简算法 [J], 常红岩;蒙祖强
3.一种新的启发式粗集决策表属性约简算法 [J], 沈玮;赵佳宝
4.一种新的基于模糊粗糙集的连续值属性约简算法 [J], 彭军锋
5.一种新的决策粗糙集最小化决策代价属性约简算法 [J], 徐道磊;陈培林;唐轶轩;吴尚;路宇;卞显福
因版权原因,仅展示原文概要,查看原文内容请购买。
新颖的无监督特征选择方法
新颖的无监督特征选择方法
朱颢东;李红婵;钟勇
【期刊名称】《电子科技大学学报》
【年(卷),期】2010(39)3
【摘要】针对有监督特征选择方法因为需要类信息而无法应用于文本聚类的问题,提出了一种新的无监督特征选择方法:结合文档频和K-Means的特征选择方法.该方法首先使用文档频进行无监督特征初选,然后再通过在不同K-Means聚类结果上使用有监督特征选择方法来实现无监督特征选择.实验表明该方法不仅能够成功地选择出最为重要的-小部分特征,而且还能提高聚类质量.
【总页数】4页(P412-415)
【作者】朱颢东;李红婵;钟勇
【作者单位】郑州轻工业学院计算机与通信工程学院,郑州,450002;中国科学院成都计算机应用研究所,成都,610041;中国科学院研究生院,北京,石景山区,100039;郑州轻工业学院计算机与通信工程学院,郑州,450002;中国科学院成都计算机应用研究所,成都,610041;中国科学院研究生院,北京,石景山区,100039
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.基于改进ReliefF的无监督特征选择方法 [J], 丁雪梅;王汉军;王炤光;周心圆
2.基于自适应局部保持投影的无监督特征选择方法 [J], 严菲;王晓栋
3.一种基于整数规划的无监督特征选择方法 [J], 姜贺云;张振宇;樊明宇
4.基于正则互表示的无监督特征选择方法 [J], 汪志远;降爱莲;奥斯曼·穆罕默德
5.基于矩阵分解填充的无监督特征选择方法 [J], 范林歌;武欣嵘;童玮;曾维军因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 几种经典特征选择方法
文本特征选择方法有很多种, 目前常用的有 WF 、DF 、IG、CH I、M I 几种方法[ 3-8] . 1. 1 文档频
式( 1) 可知, Q( f i , cj ) 不但考虑了特征所在的文档数, 而且还考虑了特征在文档中出现的次数, 从而把文档频
和词频进行了有机的结合. Q( f i , cj ) 越大则表明特征 f i 与 cj 类别的相关联程度越大, 那么该特征的分类能
力也就越强, 即该特征也就越重要.
3 属性约简算法
C(D, x) ,
Px ,
log
C( D, P(D,
x) x)
=
0,
CE ( C, P ) = 0;
第2期
朱颢东, 等: 基于类别相关性和交叉熵的特征选择方法
63
E E 2) CE ( C, P ) =
0,
C ( x ) C( D, x ) lo g
xI U
xI U
C(D, x) P( D, x)
定义 4 S= < U , C G D , V , f > 是一个信息系统, U/ ind( C) = { X 1 , X 2 , , , X n } , U/ ind( D ) = { Y1 , Y 2 ,
, , Y m} , 则称 C( D , x ) = | Y j H X i | / | X i | ( x I X i , x I Y j ) 为对象 x 在 C 上相对于 D 的概率分布[ 14] . 定义 5 信息系统 S = < U , C G D , V , f > , PP AC, 则 C 对 P 的交叉熵为[ 14] :
推论 1 S= < U, C G D , V , f > , c I C, 有 c 是 C 不必要的属性, CE( C, C- { c} ) = 0.
推论 1 的证明过程同定理 1. 推论 1 说明, 如果属性集 C 和它的一个子集 P 具有相同的分布, 则 P 是 C 的一个约简.
该属性约简算法简单步骤如下:
个, 因此类别相关性可表示为
m DF n ( f i , cj ) - D F n ( f i , ck ) 2
E Q( f i , cj ) = k= 1且k X j
E D F n ( f i , cj )
,
( 1)
i
其中, m 为类别的个数, D Fn ( f i , cj ) 是指在类别 cj 的文本训练集中出现特征f i 的次数不小于 n 的文本数. 由
摘要: 文本分类首先要解决的一个问题就是特征 选择. 简单分析 了几种经典 的特征选择 方法, 总结了它 们的不足,
提出了一个类别相关性方法, 把交叉熵引入粗糙 集并提出了 一个基 于交叉熵 的属性 约简算 法, 把 该属性 约简算 法
同类别相关性方法结合起来, 提出了一个综合的 特征选择方 法. 该 方法首 先利用 类别相 关性方法 进行特 征初选 以
特征的文档频是指在训练语料集中出现该特征的文档数. 该方法选择特征时仅考虑特征所在的文档数, 如果某个特征在训练语料集中所在的文档数达到一个事先给定的阈值, 则留下该特征, 否则删除. 这样就产 生了一个问题: 如果特征词 a 和 b 的文档频相同, 就认为这两个特征词的贡献是相同的, 从而忽略了它们在 文档中出现的次数. 但是, 在通常情况下, 文档中出现次数较少的词往往是噪声词, 这样就导致该方法所选择 的特征不具代表性. 1. 2 词频
3. 1 粗糙集基本知识
粗糙集( ro ug h set s, RS) 理论是由 Paw lak 提出来的一种处理不精确、不相容、不完全和不确定知识的软
计算工具. 其本质就是在保持分类能力不变的前提下, 通过知识约简, 导出问题的分类规则[ 9] . 目前已被广泛
应用于机器学习、决策分析、数据挖掘、过程控制、智能信息处理等领域[ 10] .
决策类的重要性, 为此本文提出了一个基于交叉熵的属性约简算法.
定义 2 信息系统 S 可以表示为 S = < U, R, V , f > , 其中 U 为对象集合, R= C G D 是属性集合, C 为
条件属性集, D 为决策属性集, V = U V r 是属性值的集合, V r 表示属性 r 的值域, f : U @ R yV 是一个映射函 rI R
5 实验例证
5. 1 实验语料库 本文选用的分类语料库是复旦大学中文文本分类语料库. 该语料库由复旦大学计算机信息与技术系国
际数据库中心自然语言处理小组构建, 语料文档全部采自互联网, 它可以从网上免费下载, 网址为: ht t p: / / ww w . nlp. org . cn/ categ ories/ def ault . php? cat_id= 16.
数, 它指定 U 中每一个对象X 的属性值. 信息系统也可用二维表来表示, 称之为决策表, 其中行代表对象 x i ,
列代表属性 r, r ( x i ) 表示第 i 个对象在属性 r 上的取值[ 12] .
3. 2 基于交叉熵的属性约简算法
定义 3 S= < U , C G D , V , f > 是一个信息系统, U / ind( C) = { X 1 , X 2, ,, X n} , 则称 C( x ) = | X i | / | U| ( x I X i ) 为对象 x 在 C 上的概率分布[ 14] .
复旦大学中文文本分类语料库中包含 20 个类别, 分为训练文档集和测试文档集两个部分. 每个部分都 包括 20 个子目录, 相同类别的文档存放在一个对应的子目录下; 每个存储文件只包含一篇文档, 所有文档均 以文件名作为唯一编号. 共有 19 637 篇文档, 其中训练文档 9 804 篇, 测试文档 9 833 篇; 训练文档和测试文 档基本按照 1 B1 的比例来划分. 去除部分重复文档和损坏文档后, 共保留有文档 14 378 篇, 其中训练文档 8 214篇, 测试文档 6 164 篇, 跨类别的重复文档没有考虑, 即一篇文档只属于一个类别. 该语料库中的文档 的类别分布情况是不均匀的. 其中, 训练文档最多的类 Economy 有 1 369 篇训练文档, 而训练文档最少的类 Co mmunicatio n 有 25 篇训练文档; 同时, 训练文档数少于 100 篇的稀有类别共有 11 个. 训练文档集和测试 文档集之间互不重叠. 本文只取前 10 个类的部分文档, 其类别文档分布如表 1 所示.
特征的词频是指特征在文档中出现的数目. 使用该方法选择特征时, 特征只有在文档中出现的次数达到 一个阈值, 才被保留, 否则予以删除. 该方法仅选择出现频繁的词作为特征, 但是有时候在某个文档中出现频 繁的特征对分类贡献并不大. 1. 3 信息增益
信息增益表示特征在某类文档中出现前后的信息熵之差, 该差用平均信息量表示. 信息增益的缺点在于
过滤 掉一些词条来降低特征空间的稀疏性, 然后利用属性 约简算法消除冗余, 从而 获得较具代 表性的特 征子集. 实
验结果表明, 此特征选择方法效果良好.
关键词: 文本分类; 特征选择; 类别相关性; 交叉熵;: A
文章编号: 1671- 6841( 2010) 02- 0061- 05
少的属性, 并在 C 中删除这样的属性, go to St ep1;
St ep5 输出 C, 算法结束.
4 本文特征选择方法基本步骤
设 T 为原始特征集, C 为类别集, 对于 Pcj I C, 设 cj 的训练文档集为 D , cj 的特征词选择算法如下: 对于每个 f i I T , 给定最小词频数 n 以及类别相关性阈值 X; St ep1 计算 f i 的 Q( f i , cj ) ; St ep2 若 Q( f i , cj ) < X, 则把 f i 从 T 中删除, 否则 f i 保留; St ep3 若 T 中还存在没考察的元素则转到 St ep1; St ep4 将 St ep3 得到的特征子集以及标有类的训练集组织成为一个决策表: S= < U, C G D , V , f > , 使 用本文提出的属性约简算法进行属性约简; St ep5 对得到的特征子集进行微调, 以突出那些对分类贡献比较大的特征词, 然后输出特征集.
62
郑州大学学报( 理学版)
第 42 卷
它不但考虑了特征出现的情况, 而且还考虑了特征未出现的情况, 也即某个特征不在文本中出现也可能对判 断文本类别有所贡献. 但实验证明, 这种贡献十分微小, 尤其是在样本分布和特征分布失衡的情况下, 某些类 别中出现的特征词占全部特征词的比例很小, 较大比例的特征词在这些类别中是不存在的, 也就是此时的信 息增益中特征不出现的部分占绝大优势, 这将导致信息增益的效果大大降低.
E E CE ( C, P ) =
x
I
C(
U
x
)
xI
C(
U
D,
x
)
log
C( P(
C, D,
x) x)
.
( 2)
定理 1 S= < U, C G D , V , f > , P AC, 有 ind( P) = ind( C) , CE( C, P) = 0.
证明
1) ind( P) = ind ( C ) , U/ ind( P ) = U/ ind( C) , Px , P ( D, x ) =
收稿日期: 2009 08 10 基金项目: 四川省科技计划项目, 编号 2008GZ0003; 四川省科技厅科技攻关项目, 编号 07G G006-014. 作者简介: 朱颢东( 1980- ) , 男, 博士研究生, 主要从事 软件过程 技术与方 法、文本挖 掘研究, E-mail: z huhaodong80@ 163. com; 通讯联 系 人: 钟勇( 1966- ) , 男, 研究员, 博士生导师, 主要从事软件过程技术与方法研究.