Complete sequencing and characterization of 21,243 full-length human cDNAs

Ota, Toshio; Suzuki, Yutaka; Nishikawa, Tetsuo; Otsuki, Tetsuji; Sugiyama, Tomoyasu; Irie, Ryotaro; Wakamatsu, Ai; Hayashi, Koji; Sato, Hiroyuki; Nagai, Keiichi; Kimura, Kouichi; Makita, Hiroshi; Sekine, Mitsuo; Obayashi, Masaya; Nishi, Tatsunari; Shibahara, Toshikazu; Tanaka, Toshihiro; Ishii, Shizuko; Yamamoto, Jun-Ichi; Saito, Kaoru; Kawai, Yuri; Isono, Yuko; Nakamura, Yoshitaka; Nagahari, Kenji; Murakami, Katsuhiko; Yasuda, Tomohiro; Iwayanagi, Takao; Wagatsuma, Masako; Shiratori, Akiko; Sudo, Hiroaki; Hosoiri, Takehiko; Kaku, Yoshiko; Kodaira, Hiroyo; Kondo, Hiroshi; Sugawara, Masanori; Takahashi, Makiko; Kanda, Katsuhiro; Yokoi, Takahide; Furuya, Takako; Kikkawa, Emiko; Omura, Yuhi; Abe, Kumi; Kamihara, Kumiko; Katsuta, Naoko; Sato, Kazuomi; Tanikawa, Machiko; Yamazaki, Makoto; Ninomiya, Ken; Ishibashi, Tadashi; Yamashita, Hiromichi; Murakawa, Katsuji; Fujimori, Kiyoshi; Tanai, Hiroyuki; Kimata, Manabu; Watanabe, Motoji; Hiraoka, Susumu; Chiba, Yoshiyuki; Ishida, Shinichi; Ono, Yukio; Takiguchi, Sumiyo; Watanabe, Susumu; Yosida, Makoto; Hotuta, Tomoko; Kusano, Junko; Kanehori, Keiichi; Takahashi-Fujii, Asako; Hara, Hiroto; Tanase, Tomo-O.; Nomura, Yoshiko; Togiya, Sakae; Komai, Fukuyo; Hara, Reiko; Takeuchi, Kazuha; Arita, Miho; Imose, Nobuyuki; Musashino, Kaoru; Yuuki, Hisatsugu; Oshima, Atsushi; Sasaki, Naokazu; Aotsuka, Satoshi; Yoshikawa, Yoko; Matsunawa, Hiroshi; Ichihara, Tatsuo; Shiohata, Namiko; Sano, Sanae; Moriya, Shogo; Momiyama, Hiroko; Satoh, Noriko; Takami, Sachiko; Terashima, Yuko; Suzuki, Osamu; Nakagawa, Satoshi; Senoh, Akihiro; Mizoguchi, Hiroshi; Goto, Yoshihiro; Shimizu, Fumio; Wakebe, Hirokazu; Hishigaki, Haretsugu; Watanabe, Takeshi; Sugiyama, Akio; Takemoto, Makoto; Kawakami, Bunsei; Yamazaki, Masaaki; Watanabe, Koji; Kumagai, Ayako; Itakura, Shoko; Fukuzumi, Yasuhito; Fujimori, Yoshifumi; Komiyama, Megumi; Tashiro, Hiroyuki; Tanigami, Akira; Fujiwara, Tsutomu; Ono, Toshihide; Yamada, Katsue; Fujii, Yuka; Ozaki, Kouichi; Hirao, Maasa; Ohmori, Yoshihiro; Kawabata, Ayako; Hikiji, Takeshi; Kobatake, Naoko; Inagaki, Hiromi; Ikema, Yasuko; Okamoto, Sachiko; Okitani, Rie; Kawakami, Takuma; Noguchi, Saori; Itoh, Tomoko; Shigeta, Keiko; Senba, Tadashi; Matsumura, Kyoka; Nakajima, Yoshie; Mizuno, Takae; Morinaga, Misato; Sasaki, Masahide; Togashi, Takushi; Oyama, Masaaki; Hata, Hiroko; Watanabe, Manabu; Komatsu, Takami; Mizushima-Sugano, Junko; Satoh, Tadashi; Shirai, Yuko; Takahashi, Yukiko; Nakagawa, Kiyomi; Okumura, Koji; Nagase, Takahiro; Nomura, Nobuo; Kikuchi, Hisashi; Masuho, Yasuhiko; Yamashita, Riu; Nakai, Kenta; Yada, Tetsushi; Nakamura, Yusuke; Ohara, Osamu; Isogai, Takao; Sugano, Sumio

Published in

Nature Research, Nature Genetics, 1(36), p. 40-45, 2003

DOI: 10.1038/ng1285

Tools

Export citation

Search in Google Scholar

Complete sequencing and characterization of 21,243 full-length human cDNAs

Journal article published in 2003 by Toshio Ota, Yutaka Suzuki, Tetsuo Nishikawa, Tetsuji Otsuki, Tomoyasu Sugiyama, Ryotaro Irie, Ai Wakamatsu, Koji Hayashi, Hiroyuki Sato, Keiichi Nagai, Kouichi Kimura, Hiroshi Makita, Mitsuo Sekine, Masaya Obayashi, Tatsunari Nishi and other authors.

This paper is made freely available by the publisher.

Full text: Download

Preprint: archiving allowed

Upload

Postprint: archiving restricted

Upload

Published version: archiving forbidden

Policy details

Data provided by

Abstract

As a base for human transcriptome and functional genomics, we created the "full-length long Japan" (FLJ) collection of sequenced human cDNAs. We determined the entire sequence of 21,243 selected clones and found that 14,490 cDNAs (10,897 clusters) were unique to the FLJ collection. About half of them (5,416) seemed to be protein-coding. Of those, 1,999 clusters had not been predicted by computational methods. The distribution of GC content of nonpredicted cDNAs had a peak at approximately 58% compared with a peak at approximately 42%for predicted cDNAs. Thus, there seems to be a slight bias against GC-rich transcripts in current gene prediction procedures. The rest of the cDNAs unique to the FLJ collection (5,481) contained no obvious open reading frames (ORFs) and thus are candidate noncoding RNAs. About one-fourth of them (1,378) showed a clear pattern of splicing. The distribution of GC content of noncoding cDNAs was narrow and had a peak at approximately 42%, relatively low compared with that of protein-coding cDNAs.

Published in

Links

Tools

Complete sequencing and characterization of 21,243 full-length human cDNAs

Abstract