651ab0ea863022e2d689561e249b52565ed1d799
[lunaix-os.git] / lunaix-os / kernel / process / sched.c
1 #include <sys/abi.h>
2 #include <sys/interrupts.h>
3 #include <sys/mm/mempart.h>
4
5 #include <hal/cpu.h>
6 #include <hal/intc.h>
7
8 #include <lunaix/fs/taskfs.h>
9 #include <lunaix/mm/cake.h>
10 #include <lunaix/mm/mmap.h>
11 #include <lunaix/mm/pmm.h>
12 #include <lunaix/mm/valloc.h>
13 #include <lunaix/mm/vmm.h>
14 #include <lunaix/process.h>
15 #include <lunaix/sched.h>
16 #include <lunaix/signal.h>
17 #include <lunaix/spike.h>
18 #include <lunaix/status.h>
19 #include <lunaix/syscall.h>
20 #include <lunaix/syslog.h>
21
22 #include <klibc/string.h>
23
24 volatile struct proc_info* __current;
25
26 static struct proc_info dummy_proc;
27
28 struct proc_info dummy;
29
30 struct scheduler sched_ctx;
31
32 struct cake_pile* proc_pile;
33
34 LOG_MODULE("SCHED")
35
36 void
37 sched_init_dummy();
38
39 void
40 sched_init()
41 {
42     proc_pile = cake_new_pile("proc", sizeof(struct proc_info), 1, 0);
43     cake_set_constructor(proc_pile, cake_ctor_zeroing);
44
45     sched_ctx = (struct scheduler){ ._procs = vzalloc(PROC_TABLE_SIZE),
46                                     .ptable_len = 0,
47                                     .procs_index = 0 };
48
49     // TODO initialize dummy_proc
50     sched_init_dummy();
51 }
52
53 #define DUMMY_STACK_SIZE 2048
54
55 void
56 sched_init_dummy()
57 {
58     // This surely need to be simplified or encapsulated!
59     // It is a living nightmare!
60
61     extern void my_dummy();
62     static char dummy_stack[DUMMY_STACK_SIZE] __attribute__((aligned(16)));
63
64     ptr_t stktop = (ptr_t)dummy_stack + DUMMY_STACK_SIZE;
65
66     dummy_proc = (struct proc_info){};
67
68     proc_init_transfer(&dummy_proc, stktop, (ptr_t)my_dummy, TRANSFER_IE);
69
70     dummy_proc.page_table = cpu_ldvmspace();
71     dummy_proc.state = PS_READY;
72     dummy_proc.parent = &dummy_proc;
73     dummy_proc.pid = KERNEL_PID;
74
75     __current = &dummy_proc;
76 }
77
78 void
79 run(struct proc_info* proc)
80 {
81     proc->state = PS_RUNNING;
82
83     intc_notify_eos(0);
84     switch_context(proc);
85 }
86
87 int
88 can_schedule(struct proc_info* proc)
89 {
90     if (!proc) {
91         return 0;
92     }
93
94     struct sighail* sh = &proc->sigctx;
95
96     if ((proc->state & PS_PAUSED)) {
97         return !!(sh->sig_pending & ~1);
98     }
99
100     if (sigset_test(sh->sig_pending, _SIGCONT)) {
101         sigset_clear(sh->sig_pending, _SIGSTOP);
102     } else if (sigset_test(sh->sig_pending, _SIGSTOP)) {
103         // 如果进程受到SIGSTOP,则该进程不给予调度。
104         return 0;
105     }
106
107     return (proc->state == PS_READY);
108 }
109
110 void
111 check_sleepers()
112 {
113     struct proc_info* leader = sched_ctx._procs[0];
114     struct proc_info *pos, *n;
115     time_t now = clock_systime();
116     llist_for_each(pos, n, &leader->sleep.sleepers, sleep.sleepers)
117     {
118         if (proc_terminated(pos)) {
119             goto del;
120         }
121
122         time_t wtime = pos->sleep.wakeup_time;
123         time_t atime = pos->sleep.alarm_time;
124
125         if (wtime && now >= wtime) {
126             pos->sleep.wakeup_time = 0;
127             pos->state = PS_READY;
128         }
129
130         if (atime && now >= atime) {
131             pos->sleep.alarm_time = 0;
132             proc_setsignal(pos, _SIGALRM);
133         }
134
135         if (!wtime && !atime) {
136         del:
137             llist_delete(&pos->sleep.sleepers);
138         }
139     }
140 }
141
142 void
143 schedule()
144 {
145     if (!sched_ctx.ptable_len) {
146         return;
147     }
148
149     // 上下文切换相当的敏感!我们不希望任何的中断打乱栈的顺序……
150     cpu_disable_interrupt();
151     struct proc_info* next;
152     int prev_ptr = sched_ctx.procs_index;
153     int ptr = prev_ptr;
154     int found = 0;
155
156     if (!(__current->state & ~PS_RUNNING)) {
157         __current->state = PS_READY;
158     }
159
160     check_sleepers();
161
162     // round-robin scheduler
163     do {
164         ptr = (ptr + 1) % sched_ctx.ptable_len;
165         next = sched_ctx._procs[ptr];
166
167         if (!(found = can_schedule(next))) {
168             if (ptr == prev_ptr) {
169                 next = &dummy_proc;
170                 goto done;
171             }
172         }
173     } while (!found);
174
175     sched_ctx.procs_index = ptr;
176
177 done:
178     run(next);
179 }
180
181 void
182 sched_yieldk()
183 {
184     cpu_enable_interrupt();
185     cpu_trap_sched();
186 }
187
188 __DEFINE_LXSYSCALL1(unsigned int, sleep, unsigned int, seconds)
189 {
190     if (!seconds) {
191         return 0;
192     }
193
194     if (__current->sleep.wakeup_time) {
195         return (__current->sleep.wakeup_time - clock_systime()) / 1000U;
196     }
197
198     struct proc_info* root_proc = sched_ctx._procs[0];
199     __current->sleep.wakeup_time = clock_systime() + seconds * 1000;
200
201     if (llist_empty(&__current->sleep.sleepers)) {
202         llist_append(&root_proc->sleep.sleepers, &__current->sleep.sleepers);
203     }
204
205     store_retval(seconds);
206
207     block_current();
208     schedule();
209
210     return 0;
211 }
212
213 // FIXME issue with alarm, paused parent process never got wake up, check what
214 // has been fucked up by refactoring.
215
216 __DEFINE_LXSYSCALL1(unsigned int, alarm, unsigned int, seconds)
217 {
218     time_t prev_ddl = __current->sleep.alarm_time;
219     time_t now = clock_systime();
220
221     __current->sleep.alarm_time = seconds ? now + seconds * 1000 : 0;
222
223     struct proc_info* root_proc = sched_ctx._procs[0];
224     if (llist_empty(&__current->sleep.sleepers)) {
225         llist_append(&root_proc->sleep.sleepers, &__current->sleep.sleepers);
226     }
227
228     return prev_ddl ? (prev_ddl - now) / 1000 : 0;
229 }
230
231 __DEFINE_LXSYSCALL1(void, exit, int, status)
232 {
233     terminate_proc(status);
234     schedule();
235 }
236
237 __DEFINE_LXSYSCALL(void, yield)
238 {
239     schedule();
240 }
241
242 pid_t
243 _wait(pid_t wpid, int* status, int options);
244
245 __DEFINE_LXSYSCALL1(pid_t, wait, int*, status)
246 {
247     return _wait(-1, status, 0);
248 }
249
250 __DEFINE_LXSYSCALL3(pid_t, waitpid, pid_t, pid, int*, status, int, options)
251 {
252     return _wait(pid, status, options);
253 }
254
255 __DEFINE_LXSYSCALL(int, geterrno)
256 {
257     return __current->k_status;
258 }
259
260 pid_t
261 _wait(pid_t wpid, int* status, int options)
262 {
263     pid_t cur = __current->pid;
264     int status_flags = 0;
265     struct proc_info *proc, *n;
266     if (llist_empty(&__current->children)) {
267         return -1;
268     }
269
270     wpid = wpid ? wpid : -__current->pgid;
271 repeat:
272     llist_for_each(proc, n, &__current->children, siblings)
273     {
274         if (!~wpid || proc->pid == wpid || proc->pgid == -wpid) {
275             if (proc->state == PS_TERMNAT && !options) {
276                 status_flags |= PEXITTERM;
277                 goto done;
278             }
279             if (proc->state == PS_READY && (options & WUNTRACED)) {
280                 status_flags |= PEXITSTOP;
281                 goto done;
282             }
283         }
284     }
285     if ((options & WNOHANG)) {
286         return 0;
287     }
288     // 放弃当前的运行机会
289     sched_yieldk();
290     goto repeat;
291
292 done:
293     if (status) {
294         *status = proc->exit_code | status_flags;
295     }
296     return destroy_process(proc->pid);
297 }
298
299 struct proc_info*
300 alloc_process()
301 {
302     pid_t i = 0;
303     for (; i < sched_ctx.ptable_len && sched_ctx._procs[i]; i++)
304         ;
305
306     if (i == MAX_PROCESS) {
307         panick("Panic in Ponyville shimmer!");
308     }
309
310     if (i == sched_ctx.ptable_len) {
311         sched_ctx.ptable_len++;
312     }
313
314     struct proc_info* proc = cake_grab(proc_pile);
315
316     proc->state = PS_CREATED;
317     proc->pid = i;
318     proc->mm.pid = i;
319     proc->created = clock_systime();
320     proc->pgid = proc->pid;
321     proc->fdtable = vzalloc(sizeof(struct v_fdtable));
322
323     llist_init_head(&proc->mm.regions);
324     llist_init_head(&proc->tasks);
325     llist_init_head(&proc->children);
326     llist_init_head(&proc->grp_member);
327     llist_init_head(&proc->sleep.sleepers);
328     waitq_init(&proc->waitqueue);
329
330     sched_ctx._procs[i] = proc;
331
332     return proc;
333 }
334
335 void
336 commit_process(struct proc_info* process)
337 {
338     assert(process == sched_ctx._procs[process->pid]);
339
340     if (process->state != PS_CREATED) {
341         __current->k_status = EINVAL;
342         return;
343     }
344
345     // every process is the child of first process (pid=1)
346     if (!process->parent) {
347         process->parent = sched_ctx._procs[1];
348     }
349
350     llist_append(&process->parent->children, &process->siblings);
351     llist_append(&sched_ctx._procs[0]->tasks, &process->tasks);
352
353     process->state = PS_READY;
354 }
355
356 // from <kernel/process.c>
357 extern void
358 __del_pagetable(pid_t pid, ptr_t mount_point);
359
360 pid_t
361 destroy_process(pid_t pid)
362 {
363     int index = pid;
364     if (index <= 0 || index > sched_ctx.ptable_len) {
365         __current->k_status = EINVAL;
366         return -1;
367     }
368
369     struct proc_info* proc = sched_ctx._procs[index];
370     sched_ctx._procs[index] = 0;
371
372     llist_delete(&proc->siblings);
373     llist_delete(&proc->grp_member);
374     llist_delete(&proc->tasks);
375     llist_delete(&proc->sleep.sleepers);
376
377     taskfs_invalidate(pid);
378
379     if (proc->cwd) {
380         vfs_unref_dnode(proc->cwd);
381     }
382
383     for (size_t i = 0; i < VFS_MAX_FD; i++) {
384         struct v_fd* fd = proc->fdtable->fds[i];
385         if (fd) {
386             vfs_pclose(fd->file, pid);
387             vfs_free_fd(fd);
388         }
389     }
390
391     vfree(proc->fdtable);
392
393     vmm_mount_pd(VMS_MOUNT_1, proc->page_table);
394
395     struct mm_region *pos, *n;
396     llist_for_each(pos, n, &proc->mm.regions, head)
397     {
398         mem_sync_pages(VMS_MOUNT_1, pos, pos->start, pos->end - pos->start, 0);
399         region_release(pos);
400     }
401
402     __del_pagetable(pid, VMS_MOUNT_1);
403
404     vmm_unmount_pd(VMS_MOUNT_1);
405
406     cake_release(proc_pile, proc);
407
408     return pid;
409 }
410
411 void
412 terminate_proc(int exit_code)
413 {
414     __current->state = PS_TERMNAT;
415     __current->exit_code = exit_code;
416
417     proc_setsignal(__current->parent, _SIGCHLD);
418 }
419
420 struct proc_info*
421 get_process(pid_t pid)
422 {
423     int index = pid;
424     if (index < 0 || index > sched_ctx.ptable_len) {
425         return NULL;
426     }
427     return sched_ctx._procs[index];
428 }
429
430 int
431 orphaned_proc(pid_t pid)
432 {
433     if (!pid)
434         return 0;
435     if (pid >= sched_ctx.ptable_len)
436         return 0;
437     struct proc_info* proc = sched_ctx._procs[pid];
438     struct proc_info* parent = proc->parent;
439
440     // 如果其父进程的状态是terminated 或 destroy中的一种
441     // 或者其父进程是在该进程之后创建的,那么该进程为孤儿进程
442     return proc_terminated(parent) || parent->created > proc->created;
443 }