442921ebccfb444fd13d1374988f5fdbe7cef108
[lunaix-os.git] / lunaix-os / kernel / sched.c
1 #include <arch/x86/interrupts.h>
2 #include <arch/x86/tss.h>
3 #include <hal/apic.h>
4 #include <hal/cpu.h>
5 #include <lunaix/mm/kalloc.h>
6 #include <lunaix/mm/vmm.h>
7 #include <lunaix/process.h>
8 #include <lunaix/sched.h>
9
10 #include <lunaix/spike.h>
11 #include <lunaix/status.h>
12 #include <lunaix/syscall.h>
13 #include <lunaix/syslog.h>
14
15 #define MAX_PROCESS 512
16
17 volatile struct proc_info* __current;
18
19 struct proc_info dummy;
20
21 extern void __proc_table;
22
23 struct scheduler sched_ctx;
24
25 LOG_MODULE("SCHED")
26
27 void
28 sched_init()
29 {
30     size_t pg_size = ROUNDUP(sizeof(struct proc_info) * MAX_PROCESS, 0x1000);
31     assert_msg(vmm_alloc_pages(
32                  KERNEL_PID, &__proc_table, pg_size, PG_PREM_RW, PP_FGPERSIST),
33                "Fail to allocate proc table");
34
35     sched_ctx = (struct scheduler){ ._procs = (struct proc_info*)&__proc_table,
36                                     .ptable_len = 0,
37                                     .procs_index = 0 };
38 }
39
40 void
41 run(struct proc_info* proc)
42 {
43     if (!(__current->state & ~PROC_RUNNING)) {
44         __current->state = PROC_STOPPED;
45     }
46     proc->state = PROC_RUNNING;
47
48     // FIXME: 这里还是得再考虑一下。
49     // tss_update_esp(__current->intr_ctx.esp);
50
51     if (__current->page_table != proc->page_table) {
52         __current = proc;
53         cpu_lcr3(__current->page_table);
54         // from now on, the we are in the kstack of another process
55     } else {
56         __current = proc;
57     }
58
59     apic_done_servicing();
60
61     asm volatile("pushl %0\n"
62                  "jmp soft_iret\n" ::"r"(&__current->intr_ctx)
63                  : "memory");
64 }
65
66 void
67 schedule()
68 {
69     if (!sched_ctx.ptable_len) {
70         return;
71     }
72
73     // 上下文切换相当的敏感!我们不希望任何的中断打乱栈的顺序……
74     cpu_disable_interrupt();
75     struct proc_info* next;
76     int prev_ptr = sched_ctx.procs_index;
77     int ptr = prev_ptr;
78     // round-robin scheduler
79     do {
80         ptr = (ptr + 1) % sched_ctx.ptable_len;
81         next = &sched_ctx._procs[ptr];
82     } while (next->state != PROC_STOPPED && ptr != prev_ptr);
83
84     sched_ctx.procs_index = ptr;
85
86     run(next);
87 }
88
89 static void
90 proc_timer_callback(struct proc_info* proc)
91 {
92     proc->timer = NULL;
93     proc->state = PROC_STOPPED;
94 }
95
96 __DEFINE_LXSYSCALL1(unsigned int, sleep, unsigned int, seconds)
97 {
98     // FIXME: sleep的实现或许需要改一下。专门绑一个计时器好像没有必要……
99     if (!seconds) {
100         return 0;
101     }
102
103     if (__current->timer) {
104         return __current->timer->counter / timer_context()->running_frequency;
105     }
106
107     struct lx_timer* timer =
108       timer_run_second(seconds, proc_timer_callback, __current, 0);
109     __current->timer = timer;
110     __current->intr_ctx.registers.eax = seconds;
111     __current->state = PROC_BLOCKED;
112     schedule();
113 }
114
115 __DEFINE_LXSYSCALL1(void, exit, int, status)
116 {
117     terminate_proc(status);
118 }
119
120 __DEFINE_LXSYSCALL(void, yield)
121 {
122     schedule();
123 }
124
125 pid_t
126 _wait(pid_t wpid, int* status, int options);
127
128 __DEFINE_LXSYSCALL1(pid_t, wait, int*, status)
129 {
130     return _wait(-1, status, 0);
131 }
132
133 __DEFINE_LXSYSCALL3(pid_t, waitpid, pid_t, pid, int*, status, int, options)
134 {
135     return _wait(pid, status, options);
136 }
137
138 pid_t
139 _wait(pid_t wpid, int* status, int options)
140 {
141     pid_t cur = __current->pid;
142     int status_flags = 0;
143     struct proc_info *proc, *n;
144     if (llist_empty(&__current->children)) {
145         return -1;
146     }
147
148     cpu_enable_interrupt();
149 repeat:
150     llist_for_each(proc, n, &__current->children, siblings)
151     {
152         if (!~wpid || proc->pid == wpid) {
153             if (proc->state == PROC_TERMNAT && !options) {
154                 status_flags |= PROCTERM;
155                 goto done;
156             }
157             if (proc->state == PROC_STOPPED && (options & WUNTRACED)) {
158                 status_flags |= PROCSTOP;
159                 goto done;
160             }
161         }
162     }
163     if ((options & WNOHANG)) {
164         return 0;
165     }
166     // 放弃当前的运行机会
167     sched_yield();
168     goto repeat;
169
170 done:
171     cpu_disable_interrupt();
172     *status = (proc->exit_code & 0xffff) | status_flags;
173     return destroy_process(proc->pid);
174 }
175
176 pid_t
177 alloc_pid()
178 {
179     pid_t i = 0;
180     for (;
181          i < sched_ctx.ptable_len && sched_ctx._procs[i].state != PROC_DESTROY;
182          i++)
183         ;
184
185     if (i == MAX_PROCESS) {
186         panick("Panic in Ponyville shimmer!");
187     }
188     return i;
189 }
190
191 void
192 push_process(struct proc_info* process)
193 {
194     int index = process->pid;
195     if (index < 0 || index > sched_ctx.ptable_len) {
196         __current->k_status = LXINVLDPID;
197         return;
198     }
199
200     if (index == sched_ctx.ptable_len) {
201         sched_ctx.ptable_len++;
202     }
203
204     sched_ctx._procs[index] = *process;
205
206     process = &sched_ctx._procs[index];
207
208     // make sure the address is in the range of process table
209     llist_init_head(&process->children);
210     // every process is the child of first process (pid=1)
211     if (process->parent) {
212         llist_append(&process->parent->children, &process->siblings);
213     } else {
214         process->parent = &sched_ctx._procs[0];
215     }
216
217     process->state = PROC_STOPPED;
218 }
219
220 // from <kernel/process.c>
221 extern void
222 __del_pagetable(pid_t pid, uintptr_t mount_point);
223
224 pid_t
225 destroy_process(pid_t pid)
226 {
227     int index = pid;
228     if (index <= 0 || index > sched_ctx.ptable_len) {
229         __current->k_status = LXINVLDPID;
230         return;
231     }
232     struct proc_info* proc = &sched_ctx._procs[index];
233     proc->state = PROC_DESTROY;
234     llist_delete(&proc->siblings);
235
236     if (proc->mm.regions) {
237         struct mm_region *pos, *n;
238         llist_for_each(pos, n, &proc->mm.regions->head, head)
239         {
240             lxfree(pos);
241         }
242     }
243
244     vmm_mount_pd(PD_MOUNT_2, proc->page_table);
245
246     __del_pagetable(pid, PD_MOUNT_2);
247
248     vmm_unmount_pd(PD_MOUNT_2);
249
250     return pid;
251 }
252
253 void
254 terminate_proc(int exit_code)
255 {
256     __current->state = PROC_TERMNAT;
257     __current->exit_code = exit_code;
258
259     schedule();
260 }
261
262 struct proc_info*
263 get_process(pid_t pid)
264 {
265     int index = pid;
266     if (index < 0 || index > sched_ctx.ptable_len) {
267         return NULL;
268     }
269     return &sched_ctx._procs[index];
270 }
271
272 int
273 orphaned_proc(pid_t pid)
274 {
275     if (!pid)
276         return 0;
277     if (pid >= sched_ctx.ptable_len)
278         return 0;
279     struct proc_info* proc = &sched_ctx._procs[pid];
280     struct proc_info* parent = proc->parent;
281
282     // 如果其父进程的状态是terminated 或 destroy中的一种
283     // 或者其父进程是在该进程之后创建的,那么该进程为孤儿进程
284     return (parent->state & PROC_TERMMASK) || parent->created > proc->created;
285 }