Supplementary Table S2. C. stercorarium DSM8532T genome sequence edits suggested by GenePRIMP/NCBI Gene(s)/Interval Suggestion Suggested by GenePRIMP Suggested by NCBI New (Deleted) Amino Acid Sequence (1) Change results in pseudogene (2) Clst_0004 Extend Y MFLHIGGDY N Clst_0021* Extend Y MTDKSKGFFTLPGEAGYEDLTLELAEKWGADVIRDSDGTVLSPRILTSGYEIYSTLCLIRGVNDWAKAHR N Clst_0130-1* Join Y - N Clst_0282** Replace Y MIQMKKDSSNIKCCKNCIKGIPVGIRNEILCREKGIVSPDFCCSKFMPFELDILQKHLGYRCCDCVHFTFTPNPKNSNYGVCSMFSVRPFDGSEKKACSKFRKRSKRTA (MKYCAVKRELFRPTSAAQNSCPSSWTFCKNIWGTGAATAFTLPLPRIRKTATTGYAACSPYARLTEVRKKHVQNSEKEAKEQHSSGKSRCFFIEIFTVFQAGFLRCFPPYQMLRLQFLCRGTCSYLFRRVSVFR) N Clst_0362/3 Insert Y LFQFLTGRLRTLKRSTRLNIQNMFQFLIGKHQTRIYDVRPEICRMLYQFLIGILKTNIFTIKT#STLLVLIPHRLNFKPVKSAINSHI N Clst_0451 Extend Y LRNPLETVTRGEEIGIGLLS N Clst_0746-7* Join Y Y SDFRKEKTTGIQPVYPLTAGITQSYMR (VTSERKKQRVFSLFIL) N Clst_0785/6 Insert Y GNDYELVRYIESKIINEKYSPERVVKNFVSD N Clst_0991-2* Join Y Y FYPHVPLLHADTLERENCQEHIPPGLI (SIPMFRCFMRTLWKGKTVRNIYRRV) N Clst_1060-1* Join Y IKNIGYIVFSFGLLFVGLNVMSDQMAPL N Clst_1117-8* Join Y YISPHNCLDV (YIYPLTIAWMY) N Clst_1134 Extend Y VGWEALISIVASMNGLFLPVLTSVCVSRIWD N Clst_1138 Extend Y MVGLGTIINTIGIIGGGLSG N Clst_2518/9** Insert Y LAKKSLIHKQKLKPKFSTRYYNRCKICGRPHAYMRKFGVCRLCFRDLAYKGQIPGVRKASW N Clst_2640 Extend Y VLYVNQQKKRRVVISD N Clst_2667/0001 Insert Y VKRTYQPKKRQRKVEHGFRKRMKTRNGRKVLKRRRLKGRKRLTA N Clst_0111-2 Join Y Y (YRNKRR) (MTVIS) Y Clst_0132-3 Extend/Join Y Y KIYLSSPHMSDEGYE KKYIFEFYRHELGQLDGIKL (KNIFLSFIDMNWDNWMVLS) Y Clst_0137 Extend Y IGDDIFKVQRVTIDIFKEVIRICDKYNINYFIIGGT Y Clst_0140-1 Join Y NPRNDLLFSDKNCKE (KSEK) Y Clst_0150-1 Join Y Y VFHAAAHKHVPL (CFMPQLINMCL) Y Clst_0156 Extend Y IYHYFSVPGYGLDNISSMVRALSN Y Clst_0189 Extend Y VGKQHINIDHPLNILRNSPHYTSDPHFRRRADMRIAR#QKFAGGRLFNLDIEITTICNLACRTCYNVSTKPQIMTVEQFSRILADARQLVECLE Y Clst_0191/2 Insert Y IHQLQLL#NIFELFTSQLKIDFYSSMFKNLDLPSKPRFPSSDHCRKGYSHRAIFKTFAVIKVER Y Clst_0337 Clip/Extend Y (KKTI) KNYLNNWMKVSEILNFFRDFYDDFNVDKAYDMLGKLKIDAKPG*KPCQREQRKKVKLILV Y Clst_0362/3 Insert Y MPVDRVDRCVRHQIHWHTNQDKF#NCIRDRARMTVFMPGPKARTFNYGPGDVGSSNRCF Y Clst_0365/6 Insert Y ENINKLIRRFIPKGTDISKVSKAKIKSIERWINEYPRRMFGYRSAIEMAV Y Clst_0375/6 Insert Y KRRLRIKNKTRFIVFVLVVLSAIVALFILRQGSEQVSYKPYRVGYGDTYWHIARELQEAGYRPRADIREIVHELIELSGIKAHELKEGDIILVPDLEELK Y Clst_0385/6 Insert Y VILLYTRHNFILTPREFVNYELEKDNNGNFKAEFPDKNNHTIDAVRYALEDDMKSGGLSILK Y Clst_0415-6 Join/Clip Y APRIFSEVYVSTNIFIEELDKQQADELKKLGYKSLNLETNRGYA (MNGLE) (PLEFFQKFMFQQIFLLRNWTSSKQMNLKN) Y Clst_0418/9 Insert Y MVIHCKMFNNQRKTLAKEYHELYINNNTETRKNKHLNERERYAIELYLKEKYTVTEIAKRLGMYGNLL Y Clst_0419-20 Join Y MLVKVLSATS#KKEIPVVDKENVIAVCIDDFAIRKRESYGTI (VGKSTICNLLKKRNTCC) Y Clst_0430-1 Join Y MLVKVLSATS#KKEIPVVDKENVIAVCIDDFAIRKRESYGTI (VGKSTICNLLKKRNTCC) Y Clst_0484-5 Join Y - Y Clst_0578-9 Join Y Y (CLGTA) Y Clst_0579 Clip Y (MRLKKASKLLSAFLTAAVFLSTVSMNFAAGFGNTAANKDLPAVVAHTEDEAICDFSAGHCAD) Y Clst_0580-1 Join Y Y NLSYDNILQIINQLISGIVKY (IYRMITYSK) Y Clst_0664/5 Insert Y MPVDRVDRCVRHQIHWHTNQDKF#NCIRDRARMTVFMPGPKARTFNYGPGDVGSSNRCF Y Clst_0665-6 Join Y Y VYGLPEQQIFPV (GIWSARAADLSGIVLQKGYSG) Y Clst_0670-1 Join Y - Y Clst_0672-3 Join Y Y SGSGRKDGFEVSK I Y Clst_0674/5 Insert Y QWNDSFYTTMYLPSAKVMATQLASLPYNLSIKLTSILGGSGKADPFYLSMVQDTGILLAMLPLIILYIFTQRYFVESIERTGIVG Y Clst_0706-7 Join Y - Y Clst_0748 Extend Y IHIVRVIAGOARG Y Clst_0770 Replace Y IENKIRCELIAPLDNFLWDRKLIKMLFGFDYTNAYTPKSQRKYGYYVLPMLYGDRFLSRVGAVRNGKDRVPEVKNIWHEDDFMPAEEVREEIAGCFNRFADFNECKNVIYYTKY (MLIHRNLRENTVIMFFPCFTATGLSRVGAVRNGKDRVPEVKNIWHEDDFMPAEEVREEIAGCFNRFADFNECKNVIYYTKY) Y Clst_0783/4 Insert Y FSFVLYLEEKYTITEIAKRLSRHRRTI#REIVRGTIYLQNSHLTYRKEYCVDVARSQLKIGNDYELVRYIESKIINEKYSPERVVKNFVSD Y Clst_0866/7 Insert Y VIQPHLPIRLPCYDFTPITDPTFDGAPPLG Y Clst_0874/5 Insert Y FTLIAYVLSTFGGLTPELLFRSFWQITLFNLFIYIGITPVIAFAAKAGINHLMSVIFAFVLGYSSMFTSGSKLLLNIYPVTAGLSVIGFRGYNPAVGNMFNPSLSVVSLILTAFLTFCIVVSTTQTEKTQRKTKSKPRRGW Y Clst_1006 Extend Y IFLLLPVIFALNLFLTSAQLAKQSCIDSSLISLRHVRDEFDNYINA Y Clst_1013-4 Join Y SQADIANTKVIVPKVEELSALGSAN (PGRYRQYKGYCSQS) Y Clst_1181-2 Join Y - Y Clst_1183/4 Insert Y LTRHYPNINKLIRRFIPKGTDISKVSKAKIKSIERWINEYPRRMFGYRSAIEMAV Y Clst_1210/1 Insert Y RRLEGEYPYLWLDATFPKVREGGRVCSMALVIAVGVN Y Clst_1280/1 Insert Y INPNDIKCYNHNPDAEPTPEPTPEPTPEPTPEPTPEPTPEPTPEPTPEPTPEPTPTPTPAP Y Clst_1335 Extend Y NQERLCEIVIDAGTLKL Y Clst_1402/3 Insert Y VILLYTRHNFILTPKVYYAHPYSSWERGTNENINKLIRRFIPKGTDISKVSKAKIKSIERWINEYPRRMFGYRSAIEMAV Y Clst_1485 Extend Y MRINPVLQKDMKTKLRGWRAPVLISCYIILLSIIMLLYFTAYDMFYPYGIVNYSPRMAVNAYNILLVFQFALLFVTVPAITATSISGERERQTL Y Clst_1577-8 Join Y Y VGFITPLLRSILFG (WVLLRRC) Y Clst_1602-3 Join Y RAEASEQLSGALNRLIALAESYPELKANENFKQLSDELAGTENRIALARMDYNNAARNYNTAIRRFP (ERKPVNSCPAL) Y Clst_1643/4 Insert Y IHQTQFYFNTPHPYSSWERGTNENINKLIRRFIPKGTDISKVSKAKIKSIERWINEYPRRMFGYRSAIEMAV Y Clst_1655-6 Join Y Y KIL (RKY) Y Clst_1733-4 Join Y Y (LKI) (YI) Y Clst_1734 Extend Y MKLYETRDIIYGFITYDDWEREIINHPVFQRLRRIKQLSLTDMVYPGANHTRFEHSLGVMHLSTLFFDSILNKRKQFLKEI Y Clst_1735 Extend Y MDRRFTFNEDVKNYDKWRPRYCK#LFNDIIHYSELNENKKT Y Clst_1737/8 Insert Y KDLQKLVEENCEELLSIRFIASEFPTGERHRGRIDTLGIDTEGNPTIIEYKKTENDYIINQGLFYLDWLVDHKGDFEVAAKKKLGNDIEINSDSVMKKLDKSKLYRL Y Clst_1739-40 Join Y - Y Clst_1744/5 Insert Y RKKKKIWTVISPRMHALRTEYARQNQLASVRAKVVMYILYHFHP#KLFEYYIFESRTGKMVNINVPNAELSYIYDLVVKHNVTISRSLRNIVYTYFAMLKKGNKVQQENLICFQALDIQKLI Y Clst_1748/9 Insert Y VILLYTRHNFILTPHPYSSWERGTNENINKLIRRFIPKGTDISKVSKAKIKSIERWINEYPRRMFGYRSAIEMAV Y Clst_1749 Clip/Extend Y (KKPQPSLL) KSLNLPYSDDELNKIKDDLKSELDLFKQRELPE Y Clst_1758-9 Join Y - Y Clst_1835/6 Insert Y SSIVTPVYEELLFRGYIWNEFRLTNEIKIYALNIILFAVWHVGYMVPNMISGDCFAVITKVFAGAVYGVILGFIRLKTGNCWSTILVHGVMNFFGLVWFIV Y Clst_1845-6 Join Y GV (VLWLVSVVKN) Y Clst_1847 Extend Y ISFQGVIVTKTYGGFL Y Clst_1852-3 Insert Y CKIKITDYRKIILWPTLLSTLAFFFMPLVHVPWAFVALVIVAIVSNYFTTA Y Clst_1853 Clip/Extend Y (SWGIPL) HGEYHSKGYGKMAYNLFEEKLKRQGCKKVRIGILQENKIAKKFWTSLGFKFC Y Clst_1856/8 Insert Y LQNSDLTYRKVYCADVAHRKICREWRNKGPQLKIGIIRKCRFTKYSFYTKINYKVISIK Y Clst_1862/3 Insert Y RIYRYARVSSTKQNLDRHIDALLAYGVEDRLIV Y Clst_1863/4 Insert Y RRRRNALIGDEIWGKSLLYLCIDESKLIGLLNIRYELPKYLAEKYGHIGYGVRPSERKKGYATTMLRHALSVCKEKGMTQVILGCYKDNVASVSIKI Y Clst_1874-5 Join Y - Y Clst_1887 Clip/Extend Y MAAKLFRVREQLLIIKVALEDIKKGNLNRRVRARENDMIKDI*YSINEIVTGYQAQLIR QEQIFQFEICDLNEVSRNIIADWIPVLTRYWPDTSLMR (RANIPV) Y Clst_1893-4 Join Y - Y Clst_1976/7 Insert Y GRKSDEYKTVGEKGEDFAVEYLKRKNYRILCRNYRAGKLGEIDLIAVKDNRIIFAEVKTRTGDIFGTPAEAVSYKKQKTIKKVASCFLKEYNMSDCEISFDVIEVIMTKDYRPVNINHIEEAF Y Clst_2098-9 Join Y Y INRW Y Clst_2102/3 Insert Y LEKEILNMDEAAELFGVSVKTFIKLLREEDVPARKIGREWRFSRKALIEWLAGGSSKMYSASE Y Clst_2115-6 Join Y Y KVRS Y Clst_2157-8 Join Y EFEYFD (NSNILTC) Y Clst_2223 Extend Y MGKIVAIGGGELRKGENTGINRFIVELSGKANPKLLFIPTVSRDAEEYIELVKSRFGELGCSADALCLVSNTYSAGQIRDMILGSDIVYVGGGDTVRMLWKHGVDKYLK Y Clst_2228/9 Insert Y VTLKAYTIGGYNYFKLRDIAKIFDIGVVWEGETSTVKIDTGIGYED Y Clst_2328-9 Join/Clip Y VFFSAGACLGSLIALY (YFFRPEHVYFH) (MLKIAWFIAIILSVPVIYIAYNYINSL) Y Clst_2369-70 Join Y Y SRTVEIASKIKNEYGIESLAHFTCVGHSIEEIDD (AVPLK) Y Clst_2414 Extend Y LAMQTRIFGGRHKHNPFESPAEFATGTTDQVNAEISKGNH Y Clst_2584/5 Insert Y MASKKKDKLRVLEFLSDKFEKGKIYTEKGVNEIIKEAHTFNDAPLLRRELYDNGFLDRTRDCR#YWKR Y Clst_2617-8 Join Y Y IPHL (IYHISCGLAEYLT) Y Clst_2663/4 Insert Y IYRNTDIRDNDTIAAVATAVGNAGISIIRMSGSEAFNIASKIFKGKGNFMEYPSHTIRYGKIVDPETNE Y (1) New sequence resulting from change with deleted sequence resulting from change in brackets. New/deleted sequence was not determined for changes suggested by NCBI. (2) Alternate reading frame identified as pseudogene or putative pseudogene by GenePRIMP/NCBI * Suggested change corroborated by RNAseq data (see Table 2) ** Suggested change corroborated by proteogenomic analysis (see Table 3)