PERL 3047 4

O temacie

Autor Żadna Głupia Spółgłoska

Zaczęty 25.06.2012 roku

Wyświetleń 3047

Odpowiedzi 4

Żadna Głupia Spółgłoska

Żadna Głupia Spółgłoska

Użytkownicy
Mniejszość Żydowska na HMS Stuleja
posty2557
Propsy3534
ProfesjaGracz
  • Użytkownicy
  • Mniejszość Żydowska na HMS Stuleja
Siema,

Wygląda na to ze wpakowałem się jak mucha w gówno :lol2:  A dokładnie najwyraźniej w celu pracy nad dysertacją (pracą licencjacką) będę musiał nauczyć się kodować/obsługiwać PERL i wychodzi na to, że tego się po prostu ode mnie oczekuje jako oczywistości :D  Jak na razie muszę jedynie przeprowadzić dwie proste operacje, tzn. wykonać dwa skrypty, które mam gotowe (A) na dwóch plikach (B), tworząc kolejne pliki wynikowe (C).

Czy ktoś się orientuje co muszę wpisać w command line, żeby słowo stało się ciałem? Chyba jestem na to zbyt głupi (albo zbyt leniwy). Moje skille są w tej kwestii praktycznie zerowe i dojście do tego z użyciem Googli może zająć mi chwilę.

Z drugiej strony, problem jest jeszcze taki, że te dwa pliki mają łącznie około 4,2GB wielkości (pliki tekstowe), a więc te dwie operacje dorobią jeszcze dwa razy tyle - a ja nawet nie mam tyle miejsca na dysku :lol2:


Pomóżcie proszę :D
 
Często odkrywa się, jak naprawdę piękną jest rzeczywiście piękna kobieta dopiero po długim z nią obcowaniu. Reguła ta stosuje się również do Niagary, majestatycznych gór i meczetów, szczególnie do meczetów.
Mark Twain

Adanos

Adanos

Administrator
Szara eminencja
posty5204
Propsy3870
ProfesjaProgramista
  • Administrator
  • Szara eminencja
Nie znam się na Perlu, ale może ci się to przydać: http://www.kt.agh.edu.pl/perl-faq/Uruchamianie :D

Chcesz wykonać skrypty na Windowsie, Linuksie? Masz zainstalowany Perl: http://www.perl.org/get.html?

Nie wiem, jak działa Perl, ale normalnie spróbowałbym coś w stylu perl "skrypt.perl" < "nazwa_pliku_wejściowego" "nazwa_pliku_wejściowego2" > "nazwa_pliku_wyjściowego"
Możliwe że będziesz musiał podać całą ścieżkę do pliku, jeśli nie będziesz chciał wykonać skryptu w katalogu, w którym znajdują się pliki wejściowe.

Żadna Głupia Spółgłoska

Żadna Głupia Spółgłoska

Użytkownicy
Mniejszość Żydowska na HMS Stuleja
posty2557
Propsy3534
ProfesjaGracz
  • Użytkownicy
  • Mniejszość Żydowska na HMS Stuleja
PERLa już zainstalowałem. Przejść do konkretnego katalogu umiem. Spróbuję z tym co podałeś, dzięki.
 
Często odkrywa się, jak naprawdę piękną jest rzeczywiście piękna kobieta dopiero po długim z nią obcowaniu. Reguła ta stosuje się również do Niagary, majestatycznych gór i meczetów, szczególnie do meczetów.
Mark Twain

mgr Fartuess

mgr Fartuess

Użytkownicy
Kiedyś to były czasy!
posty1485
Propsy890
ProfesjaProgramista
  • Użytkownicy
  • Kiedyś to były czasy!
masz wyszukać fragment tekstu w megadługim pliku używając Perla? Miałem to na jednych ćwikach z automatów i języków formalnych. Perla nie umiem, ale coś tam musiałem wykombinować. Jeśli twoje zadanie jest takie jak powiedziałem, to daj znać. Zalinkuję materiały z zajęć.
 
Popisuje się ciągle menda jedna...

Żadna Głupia Spółgłoska

Żadna Głupia Spółgłoska

Użytkownicy
Mniejszość Żydowska na HMS Stuleja
posty2557
Propsy3534
ProfesjaGracz
  • Użytkownicy
  • Mniejszość Żydowska na HMS Stuleja
Pliki wyglądają mniej więcej tak:

>scaffold9
TAGGATGAAGAAATAATGCTACCATCATTTGTAAACCTTAATAGCACTTTTAAAAAATTCTTTTTGGTATTCTCCAGTGTTCAGTGATTCATTTTGATAAAAAAAAATCTGTCTTCTTATCTGATTTAATTTTAAGGTATATTTTGGCAGAATTTTTTCTGTCTTCAATTCATTTGGAACTGCAGAGTTTGTTGTCTATTGTAATTCTTCTTCCTGAGTTTACGTTACTTTTTAAAAGAATTTTTGAAAACTATGGTTCTGTATAGTTTGATTTTTAAAGTTACTTTCTGTATTTTTTTGCTTTTCAATTATCTAGCCATTGTTGTTCAGTCTCACAGTTGTGTTCGACTCTTTTTGACCCCATGGGCTGCAGGCTTCCCTGGCCTTCACTATCTCTTGGAATTTGCTCAAACTCATGTCCATTGAGTTGGTGATGCCATCCAACCATGTCATCTTTTGTCACCCCCTTCTCCTCCTATCTTCAATTTTTCCCAGCATGAGGGTCTATTCTAATG
To całe jest uznawane przez skrypt jako jedna linia. Takich linii są tysiące. Pierwszy skrypt ma za zadanie przeliczyć ilość nukleotydów w każdej linii i dodać tę informację do pliku:

>scaffold9 887
TAGGATGAAGAAATAATGCTACCATCATTTGTAAACCTTAATAGCACTTTTAAAAAATTCTTTTTGGTATTCTCCAGTGTTCAGTGATTCATTTTGATAAAAAAAAATCTGTCTTCTTATCTGATTTAATTTTAAGGTATATTTTGGCAGAATTTTTTCTGTCTTCAATTCATTTGGAACTGCAGAGTTTGTTGTCTATTGTAATTCTTCTTCCTGAGTTTACGTTACTTTTTAAAAGAATTTTTGAAAACTATGGTTCTGTATAGTTTGATTTTTAAAGTTACTTTCTGTATTTTTTTGCTTTTCAATTATCTAGCCATTGTTGTTCAGTCTCACAGTTGTGTTCGACTCTTTTTGACCCCATGGGCTGCAGGCTTCCCTGGCCTTCACTATCTCTTGGAATTTGCTCAAACTCATGTCCATTGAGTTGGTGATGCCATCCAACCATGTCATCTTTTGTCACCCCCTTCTCCTCCTATCTTCAATTTTTCCCAGCATGAGGGTCTATTCTAATG
Natomiast drugi ma wybrać te, które są >=100000 i wrzucić je do nowego pliku.

Wychodzi jednak na to, że problem jest nie ze skryptami (bo jak je uruchomić w commandline już rokminiłem), tylko z moim komputerem - 2GB RAMu i 5GB pliku stronicowania to za mało :D  Zdecydowaliśmy, że zostanę podłączony do wydziałowego clustera (~150 komputerów), bo inaczej ominąć ograniczenia sprzętowe chyba nie da rady. W każdym razie dzięki za pomoc.

Materiały z chęcią przejrzę.
 
Często odkrywa się, jak naprawdę piękną jest rzeczywiście piękna kobieta dopiero po długim z nią obcowaniu. Reguła ta stosuje się również do Niagary, majestatycznych gór i meczetów, szczególnie do meczetów.
Mark Twain


0 użytkowników i 1 Gość przegląda ten wątek.
0 użytkowników
Do góry